San kɔ nwoma nyinaa

7個讓AI計數準確度翻倍的拍照技巧

78%的計數和98%的計數之間的差距通常不在於AI,而在於照片。這7個實用技巧修正了最常見的錯誤。

list Saa nwoma yi mu

78%的計數和98%的計數之間的差距通常不在於AI,而在於照片。

AI計數工具精確處理你給它的內容。一張清晰、光線充足、物體明顯分隔的照片會回傳近乎完美的計數。一張模糊、有陰影、物體重疊纏繞的照片只會回傳一個猜測。SNAP基準測試的研究證實,拍攝條件(燈光、曝光和相機角度)會顯著影響深度學習模型的表現,有時甚至比模型架構本身影響更大。好消息是:修正你的照片是免費的、快速的,而且效果顯著。

1. 將物體平鋪成單層

重疊是少算的頭號原因。當兩顆螺栓疊在一起時,相機只看到一個形狀。AI無法計算它看不見的東西。

拍照前,花10秒鐘將物品鋪成單一的平面層。將物件推開,直到每個之間都能看到一絲背景。僅此一項就能在密集場景中將準確度提高10到15個百分點。

快速測試

如果你從上方能看到每個單獨的物體,AI也能。如果兩個物品看起來像一個形狀,AI就會把它們算成一個。

2. 從正上方拍攝

透視變形很隱蔽。當你以45度角拍攝一盤螺絲時,後面的螺絲看起來比前面的更小、更密集。AI模型處理的是像素大小,因此看起來較小的物體被偵測的可靠性較低。

將手機或相機與表面平行,直接朝下。大多數智慧型手機的相機設定中都有網格覆蓋選項,打開它並保持表面邊緣與網格線對齊。完美的俯拍讓每個物體具有相同的像素大小,並消除深度造成的遮擋。

智慧型手機直接從上方對準一盤小型五金零件,展示AI物體計數的理想俯拍角度

3. 使用對比鮮明的背景

物體偵測的原理是尋找邊緣,即一種顏色與另一種顏色相交的邊界。當你的物體融入背景時,這些邊緣就消失了。

解決方法很簡單:使用相反色。深色物體放在淺色表面上,淺色物體放在深色表面上。深色螺絲用一張白紙,銀色墊圈用一塊黑布。避免綠色背景,因為它可能導致色彩溢出,使AI在物體邊界上產生混淆。對比度越高,偵測越乾淨。

4. 使用均勻、漫射的燈光

強烈的定向光會造成兩個問題:明亮的高光區域使細節模糊,以及深色陰影完全遮住物體。一道投在一排藥丸上的陰影可能將一個物體分裂成兩個偵測形狀,或讓一個物體消失。

計數照片的最佳光線是柔和均勻的。陰天靠近窗戶是最理想的。在室內,頂部的日光燈或LED面板效果很好。如果你只有一盞檯燈,將它反射到白色牆壁或天花板上,而不是直接照射物體。目標是物品之間沒有可見陰影的均勻亮度。

兩張相同物體的並排照片,一張有直射光造成的強烈陰影,一張有均勻漫射燈光,展示燈光如何影響可見度

5. 大量物品分批計數

試圖將500個物品塞進一張照片意味著每個物體只佔很少的像素。大約20像素以下的物體對AI來說很難與雜訊或背景紋理區分。每個物品看起來越小,模型就越困難。

對於超過100個的數量,將它們分成每張照片50到100個的批次。分別計算每批,然後加總。這確保每個物體都足夠大以進行可靠偵測,並限制了小型逐物體誤差的累積效應。五張各100個物品的照片會比一張500個物品的照片得到更準確的總數。

6. 不要使用閃光燈

手機的閃光燈從鏡頭旁的一個點光源發射。這在中心創造了一個明亮的高光區,在邊緣創造了強烈的陰影,恰好是損害偵測準確度的燈光條件。

閃光燈還會在光亮或金屬表面上產生鏡面反射,將螺絲頭變成AI無法分類的白色光斑。關閉閃光燈,依靠環境光。如果場景太暗,添加一個位於上方略偏側的獨立光源,或移到更明亮的區域。

7. 確保清晰對焦

模糊的照片會塗抹物體之間的邊緣,而這恰恰是AI偵測邊界所需的資訊。即使是手抖造成的輕微動態模糊也會降低小物品的準確度。

拍攝前點擊螢幕鎖定物體的對焦。穩穩地拿著手機,或將它靠在某個表面上。對於重要的計數,使用2秒計時器來消除按快門按鈕時的抖動。最長邊2,000像素或更高的解析度確保AI有足夠的細節可用,不過對於較大的物體,1,000像素也可以使用。

小型金屬零件的清晰與模糊照片近距離比較,展示對焦品質如何影響物體偵測

全部整合起來

  • 將物品鋪成單層,留出可見間距
  • 將相機直接從正上方拍攝
  • 將物體放在對比鮮明的背景上
  • 使用柔和、均勻的燈光,避免強烈陰影
  • 將大量物品分成50到100個一批
  • 關閉閃光燈
  • 點擊對焦並穩穩持握

這些技巧都不需要特殊設備。一部智慧型手機、一張紙和一扇窗戶就足夠了。綜合效果非常顯著:遵循這些指南的使用者穩定報告準確度超過95%,而隨意拍攝的照片只有75%到85%。

下次需要從照片中計數物體時,花30秒設置拍攝場景。那半分鐘的投資能讓你免於重數、猜疑和信任一個可能偏差20%的數字。AI已經準備好了,給它一張值得計數的照片。