- 操作系统:ubuntu22.04
- OpenCV版本:OpenCV4.9
- IDE:Visual Studio Code
- 编程语言:C++11
算法描述
执行一个均值漂移过程(mean-shift procedure),并将处理后的点的信息(它们的颜色和位置)存储在两幅图像中。
该函数将源图像中的每个像素映射到一个新的颜色和位置,从而实现:
- 颜色空间的聚类;
- 空间位置的平滑;
- 图像分割或风格化的预处理;
与 cv::cuda::meanShiftFiltering 不同的是,这个函数会输出两个结果:
- 颜色空间的结果(dstr)
- 空间位置的结果(dstsp)
函数原型
void cv::cuda::meanShiftProc
(
InputArray src,
OutputArray dstr,
OutputArray dstsp,
int sp,
int sr,
TermCriteria criteria = TermCriteria(TermCriteria::MAX_ITER+TermCriteria::EPS, 5, 1),
Stream & stream = Stream::Null()
)
参数
- src 源图像。目前仅支持 CV_8UC4 类型的图像(即:8位无符号整型、4通道图像)。
- dstr 目标图像,包含映射后点的颜色。其尺寸和类型与源图像相同。
- dstsp 目标图像,包含映射后点的位置。其尺寸与源图像相同,类型为 CV_16SC2(即:16位有符号整型的二维坐标)。
- sp 空间窗口半径(以像素为单位)。
- sr 颜色窗口半径(以颜色差异为单位)。
- criteria 终止条件。参见 TermCriteria 结构体,用于控制算法迭代的最大次数或收敛精度。
- stream 用于异步版本的 CUDA 流(Stream)。
代码示例
#include <opencv2/cudaimgproc.hpp>
#include <opencv2/opencv.hpp>
int main()
{
// Step 1: 读取图像并转换为 BGRA(4通道)
cv::Mat h_src = cv::imread( "/media/dingxin/data/study/OpenCV/sources/images/Lenna.png" );
if ( h_src.empty() )
{
std::cerr << "Failed to load image!" << std::endl;
return -1;
}
cv::Mat h_rgba;
cv::cvtColor( h_src, h_rgba, cv::COLOR_BGR2BGRA );
// Step 2: 上传图像到 GPU
cv::cuda::GpuMat d_src, d_str, d_sp;
d_src.upload( h_rgba );
// Step 3: 设置参数
int sp = 10; // 空间窗口大小
int sr = 30; // 颜色窗口大小
// Step 4: 执行均值漂移过程
cv::cuda::meanShiftProc( d_src, d_str, d_sp, sp, sr );
// Step 5: 下载结果
cv::Mat h_str, h_sp;
d_str.download( h_str ); // 新颜色图像(CV_8UC4)
d_sp.download( h_sp ); // 新空间坐标图像(CV_32FC4 或类似)
// Step 6: 显示结果
cv::imshow( "Original Image", h_src );
cv::imshow( "Color Space Result", h_str );
cv::waitKey( 0 );
return 0;
}