78%と98%のカウント精度の差は、たいていAIではなく写真にあります。
AIカウントツールは、与えられた画像をそのまま処理します。鮮明で明るく、オブジェクトがはっきり分離された写真ならほぼ完璧なカウントが返ります。ぼやけた暗い写真で重なり合ったアイテムが写っていると、結果は推測になります。SNAPベンチマークの研究でも、撮影条件(照明、露出、カメラアングル)がディープラーニングモデルの性能に大きく影響し、モデルのアーキテクチャ以上に重要な場合があることが確認されています。良い知らせは、写真の改善は無料で、すぐにでき、劇的な効果があるということです。
1. オブジェクトを一層に広げる
重なりは、カウント不足の最大の原因です。2つのボルトが重なっていると、カメラには1つの形に見えます。AIは見えないものを数えることができません。
撮影前に10秒かけて、アイテムを平らな一層に広げましょう。それぞれの間に背景が少し見えるまで離してください。これだけで密集したシーンの精度が10から15ポイント向上することがあります。
上から見てすべてのオブジェクトが個別に見えるなら、AIにも見えます。2つのアイテムが1つの形に見える場合、AIも1つとして数えます。
2. 真上から撮影する
遠近法の歪みは気づきにくいものです。ネジのトレイを45度の角度から撮影すると、奥のネジは手前のものより小さく密集して見えます。AIモデルはピクセルサイズで処理するため、小さく見えるオブジェクトは検出されにくくなります。
スマートフォンやカメラを表面と平行に、真下に向けて構えてください。ほとんどのスマートフォンにはカメラ設定にグリッド表示オプションがあります。オンにして、表面の端をグリッド線に合わせましょう。完全な真上からの撮影で、すべてのオブジェクトが同じピクセルサイズになり、奥行きによる遮蔽がなくなります。

3. コントラストのある背景を使う
オブジェクト検出はエッジ(ある色と別の色の境界)を見つけることで機能します。オブジェクトが背景に溶け込むと、そのエッジが消えてしまいます。
解決策はシンプルです。反対の色を使いましょう。暗いオブジェクトは明るい面に、明るいオブジェクトは暗い面に置きます。暗いネジには白い紙を、銀色のワッシャーには黒い布を。緑の背景は色にじみを起こし、AIのオブジェクト境界判定を混乱させることがあるため避けてください。コントラストが鮮明であるほど、検出はきれいになります。
4. 均一で拡散した照明を使う
強い直射光は2つの問題を生みます。ディテールを飛ばす明るいホットスポットと、オブジェクトを完全に隠す暗い影です。薬の列に落ちた影は、1つのオブジェクトを2つの検出形状に分割したり、オブジェクトを消してしまうことがあります。
カウント撮影に最適な光は、柔らかく均一なものです。曇りの日の窓際が理想的です。屋内では天井の蛍光灯やLEDパネルが適しています。デスクランプしかない場合は、オブジェクトに直接当てるのではなく、白い壁や天井に反射させましょう。目標は、アイテム間に目に見える影がない均一な明るさです。

5. 大量のものはバッチに分けて数える
500個のアイテムを1枚の写真に収めようとすると、各オブジェクトが占めるピクセル数が非常に少なくなります。約20ピクセル未満のオブジェクトは、AIがノイズや背景テクスチャと区別しにくくなります。各アイテムの見た目が小さくなるほど、モデルの認識精度は下がります。
100個を超える場合は、1枚あたり50から100個のバッチに分けましょう。各バッチを個別にカウントし、合計を足してください。これにより、すべてのオブジェクトが確実に検出できるサイズを維持し、小さなエラーの累積効果を抑えられます。100個ずつ5枚の写真は、500個の1枚の写真よりも正確な合計を出します。
6. フラッシュを使わない
スマートフォンのフラッシュは、レンズのすぐ横にある点光源から発光します。これにより中央に明るいホットスポット、端に強い影ができます。これはまさに検出精度を下げる照明条件です。
フラッシュはまた、光沢のある金属面にスペキュラ反射を起こし、ネジの頭を白い塊に変えてしまい、AIが分類できなくなります。フラッシュをオフにして環境光を使いましょう。シーンが暗すぎる場合は、上方やや横に別の光源を追加するか、明るい場所に移動してください。
7. ピントをしっかり合わせる
ぼやけた写真はオブジェクト間のエッジを曖昧にしますが、これはまさにAIが境界を検出するために必要な情報です。手ブレによるわずかなモーションブラーでも、小さなアイテムの精度を低下させることがあります。
撮影前に画面をタップしてオブジェクトにフォーカスをロックしてください。スマートフォンをしっかり持つか、面に固定しましょう。重要なカウントでは2秒タイマーを使い、シャッターボタンを押す際の手ブレをなくしましょう。長辺2,000ピクセル以上の解像度があれば、AIに十分なディテールが提供されます。大きなオブジェクトなら1,000ピクセルでも使用可能です。

すべてをまとめると
- アイテムを隙間が見える一層に広げる
- カメラを真上から構える
- コントラストのある背景にオブジェクトを置く
- 強い影のない柔らかく均一な照明を使う
- 大量のものは50から100個のバッチに分ける
- フラッシュをオフにする
- タップしてフォーカスを合わせ、しっかり固定する
これらのヒントに特別な機材は必要ありません。スマートフォン、紙1枚、窓があれば十分です。複合効果は劇的です。これらのガイドラインに従ったユーザーは一貫して95%以上の精度を報告しており、無計画な撮影の75から85%と比較して大幅に改善します。
次に写真からオブジェクトを数える必要があるときは、30秒かけて撮影をセットアップしてください。その30秒の投資で、数え直し、確認のやり直し、20%もずれているかもしれない数字を信じるストレスから解放されます。AIは準備できています。数える価値のある写真を撮りましょう。