基于HOG+SVM的行人检测系统实现与优化-拓冰建站

1. 项目背景与环境搭建

在计算机视觉领域，行人检测一直是个经典且实用的课题。我最近用VS2015和OpenCV实现了一个基于HOG+SVM的行人检测系统，整个过程踩了不少坑，也积累了一些经验。这个方案特别适合需要快速部署、对实时性要求不高的场景，比如商场客流统计、小区安防监控等。

1.1 开发环境准备

首先说下环境配置，这是最容易出问题的地方。我选择的是VS2015 Community版，搭配OpenCV 3.4.1。为什么不选最新版？因为在实际项目中，稳定性往往比新特性更重要。OpenCV 3.4.x系列经过长期验证，文档和社区支持都很完善。

安装时有个关键细节：一定要勾选"将OpenCV添加到系统PATH"选项。我遇到过好几次因为PATH没设置好导致项目编译失败的情况。安装完成后，建议运行OpenCV自带的示例程序验证环境是否正常。

提示：如果遇到"找不到opencv_worldxxx.dll"的错误，通常是因为系统PATH没生效。可以手动将OpenCV的bin目录（比如D:\opencv\build\x64\vc14\bin）添加到系统环境变量。

1.2 项目配置要点

在VS2015中新建C++项目后，需要配置几个关键项：

在"VC++目录"中添加包含目录和库目录
在"链接器-输入"中添加opencv_world341.lib（根据你的OpenCV版本调整数字）
将平台工具集设置为"Visual Studio 2015 (v140)"

这里有个小技巧：可以创建一个属性表（Property Sheet）保存这些配置，这样新建项目时直接导入就行，不用每次都重新设置。

2. HOG特征提取原理与实现

2.1 HOG特征的核心思想

HOG（Histogram of Oriented Gradients）是我选择的行人检测特征，它的基本思路是：人体轮廓可以通过局部区域的梯度方向分布来刻画。具体实现时，会将图像分成小的细胞单元（cell），计算每个cell的梯度方向直方图，然后将这些直方图组合起来形成最终的特征向量。

为什么HOG适合行人检测？因为它对光照变化和微小形变有很好的鲁棒性。在实际测试中，即使行人穿着不同颜色的衣服，或者在阴影区域，HOG特征都能保持较好的识别率。

2.2 OpenCV中的HOG实现

OpenCV已经内置了HOG特征的计算函数，使用起来非常方便：

cv::HOGDescriptor hog; hog.setSVMDetector(cv::HOGDescriptor::getDefaultPeopleDetector());

但默认参数不一定适合所有场景。我通过实验发现，调整以下参数可以提升检测效果：

winSize：检测窗口大小，默认是(64,128)，对于远距离行人可以适当减小
blockSize：块大小，影响特征维度
blockStride：块移动步长，值越小计算量越大但检测更精细
cellSize：细胞单元大小，通常设为(8,8)

注意：修改这些参数后需要重新训练SVM分类器，不能直接使用getDefaultPeopleDetector()。

3. SVM分类器训练与优化

3.1 样本准备与处理

好的分类器离不开高质量的训练数据。我使用了INRIA行人数据集，包含正样本（有行人）和负样本（无行人）各几千张。在实际项目中，建议根据应用场景补充一些自定义样本，比如特定角度的行人、不同穿着等。

样本处理时要注意几点：

所有图片需要缩放到相同尺寸（通常64x128）
对负样本进行难例挖掘（hard negative mining）可以显著提升效果
数据增强（翻转、轻微旋转）能增加样本多样性

3.2 SVM训练过程

OpenCV提供了SVM的实现，但默认参数效果一般。经过多次实验，我总结出一个相对稳定的配置：

cv::Ptr<cv::ml::SVM> svm = cv::ml::SVM::create(); svm->setType(cv::ml::SVM::C_SVC); svm->setKernel(cv::ml::SVM::LINEAR); svm->setC(0.01); // 惩罚参数，需要调优 svm->train(trainingData, cv::ml::ROW_SAMPLE, labels);

训练完成后，可以用svm->save()保存模型，这样部署时就不需要重新训练了。

3.3 模型评估与调优

评估分类器性能时，不能只看准确率，还要关注：

精确率（Precision）：检测出的行人中真正是行人的比例
召回率（Recall）：所有真实行人中被检测出来的比例
F1分数：精确率和召回率的调和平均

我通常保留20%的数据作为测试集。如果发现过拟合（训练集表现很好但测试集差），可以尝试：

增加正则化参数C的值
使用更多的负样本
减小HOG特征的维度

4. 完整系统实现与性能优化

4.1 检测流程实现

完整的行人检测流程包括：

图像预处理（灰度化、直方图均衡化）
多尺度滑动窗口检测
非极大值抑制（NMS）去除重复检测
结果可视化

核心代码如下：

std::vector<cv::Rect> found; hog.detectMultiScale(img, found, 0, cv::Size(8,8), cv::Size(32,32), 1.05, 2); // 应用非极大值抑制 std::vector<cv::Rect> people; for (size_t i = 0; i < found.size(); i++) { cv::Rect r = found[i]; // 过滤掉太小或太大的检测 if(r.width > 30 && r.height > 60) { people.push_back(r); } }