La differenza tra un conteggio al 78% e uno al 98% di solito non dipende dall'IA, ma dalla foto.
Gli strumenti di conteggio IA elaborano esattamente ciò che gli fornisci. Una foto nitida, ben illuminata e con oggetti chiaramente separati restituisce un conteggio quasi perfetto. Una foto sfocata, in ombra e con oggetti sovrapposti restituisce una stima approssimativa. Studi dal benchmark SNAP confermano che le condizioni di scatto (illuminazione, esposizione e angolazione) influenzano le prestazioni dei modelli di deep learning in modo significativo, talvolta più dell'architettura del modello stesso. La buona notizia: migliorare le foto è gratuito, veloce e straordinariamente efficace.
1. Disponi gli oggetti su un singolo strato
La sovrapposizione è la causa numero uno dei conteggi insufficienti. Quando due bulloni sono uno sopra l'altro, la fotocamera vede una sola forma. L'IA non può contare ciò che non riesce a vedere.
Prima di fotografare, dedicati 10 secondi a disporre gli oggetti in un singolo strato piatto. Distanzia i pezzi finché non riesci a vedere un bordo di sfondo tra ciascuno di essi. Questo accorgimento da solo può migliorare la precisione di 10-15 punti percentuali nelle scene dense.
Se riesci a vedere ogni singolo oggetto dall'alto, anche l'IA può farlo. Se due oggetti sembrano un'unica forma, l'IA li conterà come uno solo.
2. Fotografa dall'alto in perpendicolare
La distorsione prospettica è subdola. Quando fotografi un vassoio di viti con un angolo di 45 gradi, le viti sul retro appaiono più piccole e più vicine tra loro rispetto a quelle davanti. Il modello IA elabora le dimensioni in pixel, quindi gli oggetti che appaiono più piccoli vengono rilevati con meno affidabilità.
Tieni il telefono o la fotocamera paralleli alla superficie, puntando dritto verso il basso. La maggior parte degli smartphone ha un'opzione griglia nelle impostazioni della fotocamera: attivala e allinea i bordi della superficie alle linee della griglia. Uno scatto perfettamente dall'alto garantisce a ogni oggetto la stessa dimensione in pixel ed elimina l'occlusione dovuta alla profondità.

3. Usa uno sfondo a contrasto
Il rilevamento degli oggetti funziona individuando i bordi, ovvero i confini dove un colore incontra un altro. Quando gli oggetti si confondono con lo sfondo, quei bordi scompaiono.
La soluzione è semplice: usa l'opposto. Oggetti scuri su superficie chiara, oggetti chiari su superficie scura. Un foglio di carta bianca per viti scure, un panno nero per rondelle argentate. Evita gli sfondi verdi, che possono causare riflessi di colore che confondono l'IA sui confini degli oggetti. Maggiore è il contrasto, più pulito sarà il rilevamento.
4. Usa un'illuminazione uniforme e diffusa
La luce direzionale intensa crea due problemi: punti luminosi che cancellano i dettagli e ombre scure che nascondono completamente gli oggetti. Un'ombra che cade su una fila di pillole può dividere un oggetto in due forme rilevate, oppure farlo scomparire.
La luce migliore per le foto di conteggio è morbida e uniforme. Vicino a una finestra in una giornata nuvolosa è l'ideale. In interni, lampade fluorescenti o pannelli LED a soffitto funzionano bene. Se hai solo una lampada da scrivania, falla rimbalzare su un muro bianco o sul soffitto invece di puntarla direttamente sugli oggetti. L'obiettivo è una luminosità uniforme senza ombre visibili tra gli oggetti.

5. Conta in lotti per grandi quantità
Cercare di inserire 500 oggetti in una sola foto significa che ogni oggetto occupa pochissimi pixel. Gli oggetti sotto circa 20 pixel diventano difficili da distinguere dal rumore o dalla texture dello sfondo. Più piccolo appare ogni elemento, più il modello fatica.
Per quantità superiori a 100, suddividi in lotti da 50 a 100 per foto. Conta ogni lotto separatamente e somma i totali. Questo mantiene ogni oggetto abbastanza grande per un rilevamento affidabile e limita l'effetto cumulativo di piccoli errori per singolo oggetto. Cinque foto da 100 oggetti ciascuna daranno un totale più preciso di una foto da 500.
6. Evita il flash
Il flash del telefono emette luce da un punto vicino all'obiettivo. Questo crea un punto luminoso al centro e ombre nette ai bordi, esattamente le condizioni di illuminazione che penalizzano la precisione del rilevamento.
Il flash crea anche riflessi speculari su superfici lucide o metalliche, trasformando la testa di una vite in una macchia bianca che l'IA non riesce a classificare. Disattiva il flash e affidati alla luce ambientale. Se la scena è troppo scura, aggiungi una fonte di luce separata posizionata sopra e leggermente di lato, oppure spostati in un'area più luminosa.
7. Assicura una messa a fuoco nitida
Una foto sfocata confonde i bordi tra gli oggetti, che sono esattamente le informazioni di cui l'IA ha bisogno per rilevare i confini. Anche un leggero mosso causato da una mano tremolante può ridurre la precisione sugli oggetti piccoli.
Tocca lo schermo per bloccare la messa a fuoco sugli oggetti prima di scattare. Tieni il telefono fermo o appoggialo su una superficie. Per conteggi importanti, usa un timer di 2 secondi per eliminare il tremolio causato dalla pressione del pulsante di scatto. Una risoluzione di 2.000 pixel o superiore sul lato più lungo garantisce all'IA dettagli sufficienti, anche se 1.000 pixel sono utilizzabili per oggetti più grandi.

Riepilogo finale
- Disponi gli oggetti su un singolo strato con spazi visibili
- Tieni la fotocamera direttamente dall'alto
- Posiziona gli oggetti su uno sfondo a contrasto
- Usa un'illuminazione morbida e uniforme senza ombre nette
- Suddividi le grandi quantità in lotti da 50 a 100
- Disattiva il flash
- Tocca per mettere a fuoco e tieni fermo
Nessuno di questi consigli richiede attrezzature speciali. Uno smartphone, un foglio di carta e una finestra sono sufficienti. L'effetto combinato è notevole: gli utenti che seguono queste indicazioni riportano costantemente una precisione superiore al 95%, rispetto al 75-85% con foto casuali e non controllate.
La prossima volta che devi contare oggetti da una foto, dedica 30 secondi a preparare lo scatto. Quel mezzo minuto di investimento ti risparmia di ricontare, dubitare e fidarti di un numero che potrebbe essere sbagliato del 20%. L'IA è pronta. Dalle una foto che valga la pena contare.