Wróć do wszystkich artykułów

7 wskazówek fotograficznych, które podwoją dokładność liczenia AI

Różnica między liczbą z dokładnością 78% a 98% zwykle nie wynika z AI, lecz ze zdjęcia. Te 7 praktycznych wskazówek eliminuje najczęstsze błędy.

list W tym artykule

Różnica między liczbą z dokładnością 78% a 98% zwykle nie wynika z AI - wynika ze zdjęcia.

Narzędzia do liczenia AI przetwarzają dokładnie to, co im podasz. Ostre, dobrze oświetlone zdjęcie z wyraźnie oddzielonymi obiektami daje niemal idealny wynik. Rozmazane, zacienione zdjęcie z nachodzącymi na siebie przedmiotami daje zgadywanie. Badania z benchmarku SNAP potwierdzają, że warunki fotografowania - oświetlenie, ekspozycja i kąt kamery - znacząco wpływają na wydajność modeli deep learning, czasem bardziej niż sama architektura modelu. Dobra wiadomość: poprawienie zdjęć jest darmowe, szybkie i niezwykle skuteczne.

1. Rozłóż obiekty w jednej warstwie

Nakładanie się obiektów to główna przyczyna niedoliczania. Gdy dwie śruby leżą jedna na drugiej, kamera widzi jeden kształt. AI nie może policzyć tego, czego nie widzi.

Przed fotografowaniem poświęć 10 sekund na rozłożenie przedmiotów w jednej, płaskiej warstwie. Rozsuwaj elementy, aż zobaczysz pasek tła między każdym z nich. Samo to może poprawić dokładność o 10 do 15 punktów procentowych na gęstych scenach.

Szybki test

Jeśli widzisz każdy obiekt z góry, AI też go widzi. Jeśli dwa przedmioty wyglądają jak jeden kształt, AI policzy je jako jeden.

2. Fotografuj dokładnie z góry

Zniekształcenie perspektywy jest podstępne. Gdy fotografujesz tackę ze śrubami pod kątem 45 stopni, śruby z tyłu wydają się mniejsze i bliżej siebie niż te z przodu. Model AI przetwarza rozmiary pikseli, więc obiekty, które wyglądają na mniejsze, są wykrywane mniej niezawodnie.

Trzymaj telefon lub aparat równolegle do powierzchni, skierowany prosto w dół. Większość smartfonów ma opcję siatki w ustawieniach kamery - włącz ją i wyrównaj krawędzie powierzchni z liniami siatki. Idealne zdjęcie z góry daje każdemu obiektowi taki sam rozmiar w pikselach i eliminuje przesłanianie wynikające z głębi.

Smartphone held directly above a tray of small hardware parts, showing the ideal overhead angle for AI object counting

3. Użyj kontrastowego tła

Wykrywanie obiektów działa na zasadzie znajdowania krawędzi - granic, gdzie jeden kolor spotyka się z drugim. Gdy obiekty zlewają się z tłem, te krawędzie znikają.

Rozwiązanie jest proste: użyj kontrastu. Ciemne obiekty na jasnej powierzchni. Jasne obiekty na ciemnej powierzchni. Kartka białego papieru dla ciemnych śrub, czarna tkanina dla srebrnych podkładek. Unikaj zielonych teł, które mogą powodować przenikanie kolorów mylące AI przy określaniu granic obiektów. Im ostrzejszy kontrast, tym czystsza detekcja.

4. Stosuj równomierne, rozproszone oświetlenie

Ostre, kierunkowe światło tworzy dwa problemy: jasne prześwietlenia, które wymazują detale, i ciemne cienie, które całkowicie ukrywają obiekty. Cień padający na rząd tabletek może podzielić jeden obiekt na dwa wykryte kształty lub sprawić, że obiekt zniknie.

Najlepsze światło do zdjęć liczących jest miękkie i równomierne. W pobliżu okna w pochmurny dzień jest idealne. W pomieszczeniach dobrze sprawdzają się panele fluorescencyjne lub LED. Jeśli masz tylko lampkę biurkową, odbij światło od białej ściany lub sufitu zamiast kierować je bezpośrednio na obiekty. Celem jest jednolita jasność bez widocznych cieni między przedmiotami.

Two side-by-side photos of the same objects, one with harsh shadows from direct light and one with even diffused lighting showing how lighting affects visibility

5. Licz partiami przy dużych ilościach

Próba zmieszczenia 500 obiektów na jednym zdjęciu sprawia, że każdy obiekt zajmuje bardzo mało pikseli. Obiekty poniżej około 20 pikseli stają się trudne do odróżnienia od szumu lub tekstury tła. Im mniejszy każdy przedmiot na zdjęciu, tym bardziej model ma problemy.

Przy ilościach powyżej 100 podziel je na partie po 50 do 100 na zdjęcie. Policz każdą partię osobno i zsumuj wyniki. Dzięki temu każdy obiekt jest wystarczająco duży do niezawodnej detekcji, a efekt kumulacji małych błędów na obiekt jest ograniczony. Pięć zdjęć po 100 obiektów da dokładniejszy wynik niż jedno zdjęcie 500.

6. Nie używaj lampy błyskowej

Lampa błyskowa telefonu emituje światło z punktowego źródła tuż obok obiektywu. Tworzy to jasny punkt w centrum i ostre cienie na krawędziach - dokładnie takie warunki oświetleniowe, które obniżają dokładność detekcji.

Lampa błyskowa tworzy również odblaski na błyszczących lub metalowych powierzchniach, zamieniając główkę śruby w białą plamę, której AI nie jest w stanie sklasyfikować. Wyłącz lampę błyskową i polegaj na oświetleniu otoczenia. Jeśli scena jest zbyt ciemna, dodaj oddzielne źródło światła umieszczone nad i lekko z boku, lub przenieś się w jaśniejsze miejsce.

7. Zadbaj o ostry fokus

Rozmazane zdjęcie rozmywa krawędzie między obiektami, a to dokładnie informacja, której AI potrzebuje do wykrywania granic. Nawet lekkie rozmycie od ruszenia ręki może obniżyć dokładność na małych przedmiotach.

Dotknij ekranu, aby zablokować ostrość na obiektach przed zrobieniem zdjęcia. Trzymaj telefon stabilnie lub oprzyj go o powierzchnię. Przy ważnych liczeniach użyj 2-sekundowego samowyzwalacza, aby wyeliminować drgania od naciśnięcia przycisku migawki. Rozdzielczość 2000 pikseli lub wyższa na dłuższym boku zapewnia AI wystarczająco dużo szczegółów, choć nawet 1000 pikseli wystarcza dla większych obiektów.

Close-up comparison showing sharp and blurry photos of small metal parts, demonstrating how focus quality affects object detection

Podsumowanie

  • Rozłóż przedmioty w jednej warstwie z widocznymi przerwami
  • Trzymaj aparat dokładnie nad obiektami
  • Umieść obiekty na kontrastowym tle
  • Stosuj miękkie, równomierne oświetlenie bez ostrych cieni
  • Podziel duże ilości na partie po 50 do 100
  • Wyłącz lampę błyskową
  • Dotknij, aby ustawić ostrość, i trzymaj stabilnie

Żadna z tych wskazówek nie wymaga specjalnego sprzętu. Smartfon, kartka papieru i okno wystarczą. Łączny efekt jest dramatyczny: użytkownicy, którzy stosują te wytyczne, konsekwentnie raportują dokładność powyżej 95%, w porównaniu z 75 do 85% przy przypadkowych, niekontrolowanych zdjęciach.

Następnym razem, gdy będziesz musiał policzyć obiekty ze zdjęcia, poświęć 30 sekund na przygotowanie ujęcia. Ta półminutowa inwestycja oszczędza ponownego liczenia, wątpliwości i polegania na wyniku, który może być błędny o 20%. AI jest gotowe. Daj mu zdjęcie warte policzenia.