Назад на све чланке

Како AI броји објекте на фотографијама (и зашто је у томе бољи од вас)

Ваше очи се уморе после 50 завртања. AI их све избори за секунде, са обојеним тачкама на сваком од њих као доказом. Ево како то заправо функционише.

list У овом чланку

Ваше очи се уморе после 50 завртања. AI се тек загрева.

Бројање ствари ручно делује једноставно док то не постане. После отприлике 30 ставки, ваш мозак прелази са бројања на процењивање. Изгубите место, поново пребројите ред и даље се питате да ли сте погодили. AI бројање објеката приступа другачије: обрађује целу слику одједном, означава сваку пронађену ставку и враћа укупан број за секунде. Ево како то функционише.

Шта се дешава када отпремите фотографију

Када пошаљете фотографију AI алату за бројање, три ствари се дешавају у брзом низу.

Прво, систем претходно обрађује вашу слику: мења величину на стандардну димензију, нормализује боје и прилагођава однос страница. То траје милисекунде.

Затим долази детекција. Модел компјутерског вида скенира целу слику у једном пролазу. Модерне архитектуре попут YOLO (You Only Look Once) деле слику на мрежу и предвиђају позиције објеката, класификације и оцене поузданости за сваку ћелију истовремено. Замислите разлику између читања странице реч по реч и обухватања целе странице једним погледом.

За сваки објекат који модел пронађе, даје класификацију (шта мисли да је објекат), позицију (координате на слици) и оцену поузданости између 0 и 1 која представља колико је сигуран. Оцена од 0.85 значи да је модел 85% сигуран да је пронашао стварни објекат на том месту.

На крају, праг поузданости филтрира слабе детекције. Све испод прага се одбацује, чиме се смањује број лажних бројања. Преостале детекције се сабирају и приказују као обојене тачке или граничне оквире на вашој оригиналној фотографији: укупан број плус визуелна мапа тачно онога што је пребројано и где.

Метални завртњи на радном столу са зеленим AI маркерима за детекцију на сваком од њих, приказујући како функционишу преклопни слојеви за бројање објеката

Разлика у прецизности: зашто AI надмашује ваше очи

Људски вид има тврдо ограничење о коме већина људи никада не размишља. Когнитивни научници то називају субитизирање: мозак може тренутно да препозна количине од 1 до 4 ставке са скоро савршеном прецизношћу. Изнад тог прага морате бројати једну по једну, а грешке почињу да се увлаче.

Истраживање компаније Nventory открило је да људи који броје инвентар нормалном радном брзином постижу просечно око 91% прецизности - отприлике једну грешку на сваких 10 ставки. Та стопа грешке расте са умором, ометањем пажње и количином. Када зурите у 200 причвршћивача на полици, ваш мозак погађа, а не броји.

AI се не умара, не губи место и не процењује. Фино подешен модел YOLOv11 тестиран у стварним складишним условима постигао је 97% прецизности бројања кроз вишеструка тестирања (Springer, 2026). У контролисаним условима са чистим, добро осветљеним сликама, прецизност достиже 99%. Разлика се само повећава с растом количина.

Праг од 50 ставки

При 50 ставки, прецизност бројања човека и AI-ја је упоредива. При 500, AI једва успорава док ваша стопа грешке расте са сваком минутом која пролази. Што је већи број, већа је предност.

Брзина: минути наспрам секунди

Складишни радник који ручно броји инвентар обради отприлике 250 до 750 ставки на сат. Потпуно физичко пребројавање средњег складишта траје 1 до 3 дана са тимом.

AI систем за бројање обради једну слику за мање од 250 милисекунди на модерном хардверу. Чак и на паметном телефону обично траје 1 до 3 секунде. Једна фотографија може садржати стотине ставки, све пребројане у једном пролазу.

Математика је неравномерна. Задатак који тиму од четворо људи одузме 8-часовни радни дан - око 2,500 артикала - може се обавити за минуте када се свака полица фотографише и обради. Уско грло се помера са бројања на фотографисање.

Складишни радник у заштитном прслуку гледа ка високим полицама натрпаним стотинама кутија, приказујући размере ручног бројања инвентара

Где AI бројање има потешкоћа

AI бројање није непогрешиво. Познавање његових слабих тачака помаже вам да одлучите када му веровати, а када проверити резултат.

Преклапајући и наслагани објекти

Модел види само оно што је на површини. Ставке затрпане испод невидљиве су за камеру. Истраживање ICCV 2025 потврдило је да наслагани објекти остају један од најтежих проблема бројања.

Врло мали објекти

Ставке мање од отприлике 20 пиксела на слици постају тешке за разликовање од шума. Фотографије веће резолуције помажу, али постоји практично ограничење.

Густе, закрчене сцене

Како се објекти збијају заједно, модел може спојити суседне ставке у једну детекцију или пропустити објекте стиснуте између других.

Провидни или рефлектујући предмети

Стакло, провидна пластика и сјајне површине немају изразите ивице, што доводи до пропуштених или фантомских бројања.

Врло велике количине у једном кадру

Бројања изнад 1,000 на једној слици појачавају мале грешке по објекту у приметна укупна одступања. Подела на више фотографија решава овај проблем.

Када ручно бројање ипак побеђује

AI-ју су потребни видљиви објекти на фотографији. Постоје ситуације у којима је људска процена и даље бољи алат:

  • Мање од 10 ставки - Способност вашег мозга за субитизирање чини брзи поглед бржим од било које апликације.
  • Потпуно скривени објекти - Ставке унутар затворених кутија, иза зидова или испод других предмета невидљиве су за камеру.
  • Мешане неправилне гомиле - Неред од врло различитих објеката у насумичним оријентацијама може збунити моделе који очекују визуелну доследност.
  • Нема доступне камере - Понекад је најбржи пут једноставно пребројати ручно.

Практична граница: ако су сви објекти јасно видљиви и има их више од отприлике 20, AI скоро увек даје бржи и прецизнији резултат.

Особа држи паметни телефон да фотографише мале електронске компоненте расуте по тамној површини, приказујући колико је лако бројати објекте телефоном

Закључак

AI бројање је сада брже, прецизније и доследније од ручног бројања за већину практичних сценарија. Преостала ограничења су стварна, али добро разумљива, и смањују се са сваком новом генерацијом модела.

Следећи пут када се нађете пред полицом делова, послужавником компоненти или палетом кутија, покушајте да фотографишете уместо да бројите ручно. Добићете одговор за секунде, и вероватно ће бити прецизнији од вашег.