Разница между подсчётом с точностью 78% и 98% обычно кроется не в ИИ, а в фотографии.
Инструменты подсчёта на основе ИИ обрабатывают именно то, что вы им даёте. Чёткое, хорошо освещённое фото с явно разделёнными объектами даёт почти идеальный результат. Размытое, затенённое нагромождение перекрывающихся предметов приводит к приблизительным подсчётам. Исследования на основе бенчмарка SNAP подтверждают, что условия съёмки - освещение, экспозиция и угол камеры - существенно влияют на производительность моделей глубокого обучения, иногда даже сильнее, чем архитектура самой модели. Хорошая новость: исправить фотографии можно бесплатно, быстро и с впечатляющим результатом.
1. Разложите объекты в один слой
Перекрытие - главная причина недосчёта. Когда два болта лежат друг на друге, камера видит одну фигуру. ИИ не может подсчитать то, что не видит.
Перед съёмкой потратьте 10 секунд на то, чтобы разложить предметы в один плоский слой. Раздвиньте их так, чтобы между каждым был виден кусочек фона. Одно это может повысить точность на 10-15 процентных пунктов для плотных сцен.
Если вы видите каждый отдельный объект сверху, ИИ тоже его увидит. Если два предмета выглядят как одна фигура, ИИ посчитает их за один.
2. Снимайте строго сверху
Перспективное искажение действует незаметно. Когда вы фотографируете поднос с шурупами под углом 45 градусов, шурупы на дальнем крае выглядят меньше и ближе друг к другу, чем на переднем. Модель ИИ обрабатывает размеры в пикселях, поэтому объекты, которые кажутся меньше, распознаются менее надёжно.
Держите телефон или камеру параллельно поверхности, направив строго вниз. В большинстве смартфонов есть сетка в настройках камеры - включите её и выровняйте края поверхности по линиям сетки. Идеально вертикальный снимок даёт каждому объекту одинаковый размер в пикселях и устраняет перекрытие из-за глубины.

3. Используйте контрастный фон
Обнаружение объектов работает за счёт поиска границ - мест, где один цвет переходит в другой. Когда объекты сливаются с фоном, эти границы исчезают.
Решение простое: используйте противоположность. Тёмные предметы кладите на светлую поверхность. Светлые предметы - на тёмную. Лист белой бумаги для тёмных шурупов, чёрная ткань для серебристых шайб. Избегайте зелёных фонов, которые могут вызвать цветовые помехи и запутать ИИ на границах объектов. Чем резче контраст, тем чище распознавание.
4. Используйте равномерное рассеянное освещение
Резкий направленный свет создаёт две проблемы: яркие засветы, которые размывают детали, и тёмные тени, которые полностью скрывают объекты. Тень, падающая на ряд таблеток, может разбить один объект на две обнаруженные формы или сделать объект невидимым.
Лучший свет для подсчётных фотографий - мягкий и равномерный. Идеально подходит место у окна в пасмурный день. В помещении хорошо работают потолочные люминесцентные лампы или LED-панели. Если у вас есть только настольная лампа, направьте свет на белую стену или потолок, а не прямо на объекты. Цель - равномерная яркость без видимых теней между предметами.

5. Считайте партиями при больших количествах
Попытка уместить 500 предметов в одно фото означает, что каждый объект занимает очень мало пикселей. Объекты размером менее примерно 20 пикселей становятся трудноотличимыми от шума или текстуры фона. Чем меньше выглядит каждый предмет, тем сложнее модели его распознать.
Для количеств свыше 100 разделите их на партии по 50-100 штук на фото. Подсчитайте каждую партию отдельно и сложите итоги. Это сохраняет каждый объект достаточно крупным для надёжного распознавания и ограничивает накопление мелких ошибок. Пять фотографий по 100 предметов дадут более точный итог, чем одно фото с 500.
6. Откажитесь от вспышки
Вспышка телефона работает как точечный источник света прямо рядом с объективом. Это создаёт яркое пятно в центре и резкие тени по краям - именно те условия освещения, которые снижают точность распознавания.
Вспышка также создаёт зеркальные блики на глянцевых или металлических поверхностях, превращая шляпку шурупа в белое пятно, которое ИИ не может классифицировать. Выключите вспышку и используйте окружающий свет. Если сцена слишком тёмная, добавьте отдельный источник света сверху и чуть сбоку или переместитесь в более светлое место.
7. Обеспечьте чёткую фокусировку
Размытое фото смазывает границы между объектами, а это именно та информация, которая нужна ИИ для определения контуров. Даже лёгкое размытие от движения из-за дрожания руки может снизить точность на мелких предметах.
Нажмите на экран, чтобы зафиксировать фокус на объектах перед съёмкой. Держите телефон неподвижно или обоприте его обо что-нибудь. Для важных подсчётов используйте таймер на 2 секунды, чтобы исключить дрожание при нажатии кнопки затвора. Разрешение от 2 000 пикселей по длинной стороне обеспечивает ИИ достаточно деталей для работы, хотя для крупных объектов достаточно и 1 000 пикселей.

Подводим итоги
- Разложите предметы в один слой с видимыми зазорами
- Держите камеру строго над объектами
- Разместите предметы на контрастном фоне
- Используйте мягкое, равномерное освещение без резких теней
- Разделите большие количества на партии по 50-100 штук
- Выключите вспышку
- Нажмите для фокусировки и держите телефон неподвижно
Ни один из этих советов не требует специального оборудования. Смартфон, лист бумаги и окно - этого достаточно. Совокупный эффект впечатляет: пользователи, которые следуют этим рекомендациям, стабильно получают точность выше 95%, по сравнению с 75-85% при обычных неконтролируемых фотографиях.
В следующий раз, когда вам нужно подсчитать объекты по фотографии, потратьте 30 секунд на подготовку кадра. Эти полминуты избавят вас от повторного подсчёта, сомнений и доверия к числу, которое может отличаться на 20%. ИИ готов. Дайте ему фотографию, которую стоит считать.