78%的計數和98%的計數之間的差距通常不在於AI,而在於照片。
AI計數工具精確處理你給它的內容。一張清晰、光線充足、物體明顯分隔的照片會回傳近乎完美的計數。一張模糊、有陰影、物體重疊纏繞的照片只會回傳一個猜測。SNAP基準測試的研究證實,拍攝條件(燈光、曝光和相機角度)會顯著影響深度學習模型的表現,有時甚至比模型架構本身影響更大。好消息是:修正你的照片是免費的、快速的,而且效果顯著。
1. 將物體平鋪成單層
重疊是少算的頭號原因。當兩顆螺栓疊在一起時,相機只看到一個形狀。AI無法計算它看不見的東西。
拍照前,花10秒鐘將物品鋪成單一的平面層。將物件推開,直到每個之間都能看到一絲背景。僅此一項就能在密集場景中將準確度提高10到15個百分點。
如果你從上方能看到每個單獨的物體,AI也能。如果兩個物品看起來像一個形狀,AI就會把它們算成一個。
2. 從正上方拍攝
透視變形很隱蔽。當你以45度角拍攝一盤螺絲時,後面的螺絲看起來比前面的更小、更密集。AI模型處理的是像素大小,因此看起來較小的物體被偵測的可靠性較低。
將手機或相機與表面平行,直接朝下。大多數智慧型手機的相機設定中都有網格覆蓋選項,打開它並保持表面邊緣與網格線對齊。完美的俯拍讓每個物體具有相同的像素大小,並消除深度造成的遮擋。

3. 使用對比鮮明的背景
物體偵測的原理是尋找邊緣,即一種顏色與另一種顏色相交的邊界。當你的物體融入背景時,這些邊緣就消失了。
解決方法很簡單:使用相反色。深色物體放在淺色表面上,淺色物體放在深色表面上。深色螺絲用一張白紙,銀色墊圈用一塊黑布。避免綠色背景,因為它可能導致色彩溢出,使AI在物體邊界上產生混淆。對比度越高,偵測越乾淨。
4. 使用均勻、漫射的燈光
強烈的定向光會造成兩個問題:明亮的高光區域使細節模糊,以及深色陰影完全遮住物體。一道投在一排藥丸上的陰影可能將一個物體分裂成兩個偵測形狀,或讓一個物體消失。
計數照片的最佳光線是柔和均勻的。陰天靠近窗戶是最理想的。在室內,頂部的日光燈或LED面板效果很好。如果你只有一盞檯燈,將它反射到白色牆壁或天花板上,而不是直接照射物體。目標是物品之間沒有可見陰影的均勻亮度。

5. 大量物品分批計數
試圖將500個物品塞進一張照片意味著每個物體只佔很少的像素。大約20像素以下的物體對AI來說很難與雜訊或背景紋理區分。每個物品看起來越小,模型就越困難。
對於超過100個的數量,將它們分成每張照片50到100個的批次。分別計算每批,然後加總。這確保每個物體都足夠大以進行可靠偵測,並限制了小型逐物體誤差的累積效應。五張各100個物品的照片會比一張500個物品的照片得到更準確的總數。
6. 不要使用閃光燈
手機的閃光燈從鏡頭旁的一個點光源發射。這在中心創造了一個明亮的高光區,在邊緣創造了強烈的陰影,恰好是損害偵測準確度的燈光條件。
閃光燈還會在光亮或金屬表面上產生鏡面反射,將螺絲頭變成AI無法分類的白色光斑。關閉閃光燈,依靠環境光。如果場景太暗,添加一個位於上方略偏側的獨立光源,或移到更明亮的區域。
7. 確保清晰對焦
模糊的照片會塗抹物體之間的邊緣,而這恰恰是AI偵測邊界所需的資訊。即使是手抖造成的輕微動態模糊也會降低小物品的準確度。
拍攝前點擊螢幕鎖定物體的對焦。穩穩地拿著手機,或將它靠在某個表面上。對於重要的計數,使用2秒計時器來消除按快門按鈕時的抖動。最長邊2,000像素或更高的解析度確保AI有足夠的細節可用,不過對於較大的物體,1,000像素也可以使用。

全部整合起來
- 將物品鋪成單層,留出可見間距
- 將相機直接從正上方拍攝
- 將物體放在對比鮮明的背景上
- 使用柔和、均勻的燈光,避免強烈陰影
- 將大量物品分成50到100個一批
- 關閉閃光燈
- 點擊對焦並穩穩持握
這些技巧都不需要特殊設備。一部智慧型手機、一張紙和一扇窗戶就足夠了。綜合效果非常顯著:遵循這些指南的使用者穩定報告準確度超過95%,而隨意拍攝的照片只有75%到85%。
下次需要從照片中計數物體時,花30秒設置拍攝場景。那半分鐘的投資能讓你免於重數、猜疑和信任一個可能偏差20%的數字。AI已經準備好了,給它一張值得計數的照片。