78%和98%计数精度之间的差异通常不在AI,而在照片。
AI计数工具会完全按照你提供的图像来处理。一张清晰、光线充足、对象分离明显的照片能返回接近完美的计数。一张模糊、阴暗、物品重叠的照片返回的只是猜测。SNAP基准测试的研究证实,拍摄条件(光线、曝光和相机角度)会显著影响深度学习模型的表现,有时甚至比模型架构本身更重要。好消息是,改善照片是免费的、快速的,而且效果显著。
1. 将物品平铺成单层
重叠是漏计的头号原因。当两颗螺栓叠在一起时,相机只能看到一个形状。AI无法计数它看不到的东西。
拍照前花10秒钟将物品平铺成单层。把物件推开,直到每个之间能看到一线背景。仅这一项操作就能将密集场景的精度提高10到15个百分点。
如果你从上方能看到每一个独立的对象,AI也能看到。如果两个物品看起来像一个形状,AI也会把它们算成一个。
2. 从正上方拍摄
透视畸变不容易察觉。当你以45度角拍摄一盘螺丝时,后排的螺丝看起来比前排的更小、更密集。AI模型按像素大小处理,因此看起来更小的对象检测可靠性更低。
将手机或相机平行于表面,镜头垂直向下。大多数智能手机在相机设置中都有网格线选项,打开它并让表面边缘与网格线对齐。完美的俯拍让每个对象拥有相同的像素大小,消除了深度遮挡。

3. 使用对比色背景
对象检测通过寻找边缘(一种颜色与另一种颜色的交界)来工作。当对象融入背景时,这些边缘就消失了。
解决方法很简单:使用反差色。深色物品放在浅色表面上,浅色物品放在深色表面上。深色螺丝用白纸,银色垫圈用黑布。避免绿色背景,因为它会产生色溢,干扰AI对对象边界的判断。对比越鲜明,检测越清晰。
4. 使用均匀柔和的光线
强烈的直射光会产生两个问题:过曝的亮点会冲掉细节,深暗的阴影会完全遮住物品。阴影落在一排药丸上可能会将一个对象分割成两个检测形状,或让一个对象消失不见。
拍摄计数照片最理想的光线是柔和均匀的。阴天窗边的光线最为理想。室内环境下,天花板上的荧光灯或LED面板效果很好。如果只有台灯,请将光线反射到白色墙壁或天花板上,而不是直接照射物品。目标是物品之间没有可见阴影的均匀亮度。

5. 大批量物品分批计数
将500个物品塞进一张照片意味着每个对象只占很少的像素。大约20像素以下的对象,AI很难将其与噪点或背景纹理区分开。每个物品显示得越小,模型的识别难度越大。
数量超过100个时,将它们分成每张照片50到100个的批次。分别计数每批,然后把总数加起来。这样可以确保每个对象都保持足够大的尺寸以实现可靠检测,并限制小误差的累积效应。5张各100个物品的照片比1张500个物品的照片能给出更准确的总数。
6. 不要使用闪光灯
手机闪光灯从紧靠镜头的点光源发出。这会在中央产生明亮的过曝点,在边缘产生强烈的阴影,这正是降低检测精度的光照条件。
闪光灯还会在有光泽的金属表面产生镜面反射,把螺丝头变成一团白色,AI无法分类。关闭闪光灯,依靠环境光。如果场景太暗,在上方或稍侧的位置添加一个独立光源,或移到更亮的区域。
7. 确保对焦清晰
模糊的照片会抹糊对象之间的边缘,而这恰恰是AI检测边界所需要的信息。即使手抖导致的轻微运动模糊也会降低小物品的计数精度。
拍摄前点击屏幕锁定对焦到物品上。稳定握住手机,或将其靠在一个平面上。重要的计数任务可以使用2秒定时器来消除按快门时的抖动。长边2,000像素以上的分辨率能为AI提供足够的细节,大型物品1,000像素也可以使用。

汇总所有要点
- 将物品平铺成单层,留出可见间隙
- 从正上方拍摄
- 将对象放在对比色背景上
- 使用柔和均匀的光线,避免强烈阴影
- 大批量物品分成50到100个一批
- 关闭闪光灯
- 点击对焦并保持稳定
这些技巧不需要任何特殊设备。一部智能手机、一张纸和一扇窗户就够了。综合效果非常显著:遵循这些指南的用户持续报告95%以上的精度,而随意拍摄的照片精度通常只有75%到85%。
下次需要通过照片计数对象时,花30秒准备拍摄环境。这半分钟的投入能让你免于重复计数、反复确认,以及信任一个可能偏差20%的数字。AI已经准备好了,给它一张值得计数的照片吧。