Nazaj na vse članke

Kako AI steje predmete na fotografijah (in zakaj je v tem boljsa od vas)

Vase oci se utrudijo po 50 vijakih. AI jih vse presteje v sekundah, z barvnimi pikami na vsakem kot dokaz. Tukaj je, kako to dejansko deluje.

list V tem članku

Vase oci se utrudijo po 50 vijakih. AI se sele ogriva.

Rocno stetje predmetov se zdi preprosto, dokler ni vec. Po priblizno 30 kosih vasi mozgani preidejo s stetja na ocenjevanje. Izgubite pregled, znova prestejete vrsto in se vedno niste prepricani, da ste pravilno stejli. AI stetje predmetov pristopi drugace: obdela celotno sliko naenkrat, oznaci vsak najden element in v sekundah vrne vsoto. Tako deluje.

Kaj se zgodi, ko nalozite fotografijo

Ko posljete fotografijo v orodje za AI stetje, se v hitrem zaporedju zgodijo tri stvari.

Najprej sistem predhodno obdela vaso sliko: jo spremeni na standardno velikost, normalizira barve in prilagodi razmerje stranic. To traja milisekunde.

Nato sledi zaznavanje. Model racunalniskega vida pregleda celotno sliko v enem samem prehodu. Moderne arhitekture, kot je YOLO (You Only Look Once), razdelijo sliko na mrezo in hkrati napovedujejo polozaje predmetov, klasifikacije in ocene zanesljivosti za vsako celico. Predstavljajte si razliko med branjem strani besedo po besedo in zajemanjem celotne strani z enim pogledom.

Za vsak najden predmet model izda klasifikacijo (kaj meni, da je predmet), lokacijo (koordinate na sliki) in oceno zanesljivosti med 0 in 1, ki predstavlja stopnjo gotovosti. Ocena 0.85 pomeni, da je model 85% prepircan, da je na tem mestu nasel resnicen predmet.

Na koncu prag zanesljivosti odfiltrira sibke zaznavanja. Vse pod mejo se zavrze, kar zmanjsa napacna stetja. Preostale zaznave se sestejejo in prikazejo kot barvne pike ali mejni okvirji na vasi izvirni fotografiji: skupni sestevek in vizualni zemljevid, kaj tocno je bilo presteto in kje.

Kovinski vijaki na delovni mizi z zelenimi AI zaznavnimi oznakami na vsakem, ki prikazujejo delovanje prekrivanja stetja predmetov

Vrzel v natancnosti: zakaj AI premaguje vase oci

Cloveski vid ima trdo omejitev, o kateri vecina ljudi nikoli ne razmislja. Kognitivni znanstveniki to imenujejo subitizacija: mozgani lahko takoj prepoznajo kolicine od 1 do 4 predmetov s skoraj popolno natancnostjo. Nad tem pragom morate steti enega po enega in napake se zacnejo prikradati.

Raziskava podjetja Nventory je ugotovila, da ljudje, ki stejejo inventar pri normalni delovni hitrosti, v povprecju dosegajo priblizno 91% natancnost, kar je priblizno ena napaka na vsakih 10 predmetov. Ta stopnja napak narasca z utrujenostjo, motnjami in kolicino. Ko zrete na 200 pritrdilnih elementov na polici, vasi mozgani ugibajo, ne stejejo.

AI se ne utrudi, ne izgubi pregleda in ne ocenjuje. Fino nastavljen model YOLOv11, testiran v resnicnih skladiscnih pogojih, je dosegel 97% natancnost stetja v vec krogih testiranja (Springer, 2026). V nadzorovanih pogojih s cistimi, dobro osvetljenimi slikami natancnost doseze 99%. Vrzel se samo siri, ko kolicine rastejo.

Prag 50 predmetov

Pri 50 predmetih sta natancnost stetja cloveka in AI primerljivi. Pri 500 se AI komaj upocasni, medtem ko vasa stopnja napak narasca z vsako minuto. Vecje ko je stevilo, vecja je prednost.

Hitrost: minute proti sekundam

Skladiscni delavec, ki rocno steje inventar, obdela priblizno 250 do 750 predmetov na uro. Celotno fizicno stetje srednje velikega skladisca traja 1 do 3 dni z ekipo.

Sistem AI stetja obdela eno sliko v manj kot 250 milisekundah na sodobni strojni opremi. Tudi na pametnem telefonu to obicajno traja 1 do 3 sekunde. Ena fotografija lahko vsebuje na stotine predmetov, vsi presteti v enem samem prehodu.

Matematika je enostranska. Naloga, za katero ekipa stirih ljudi potrebuje 8-urni delovni dan, priblizno 2,500 artiklov, se da opraviti v minutah, ko vsako polico fotografirate in obdelate. Ozko grlo se premakne s stetja na fotografiranje.

Skladiscni delavec v varnostnem telovniku gleda navzgor na visoke police, napolnjene s stotinami skatel, kar prikazuje obseg rocnega stetja inventarja

Kje ima AI stetje tezave

AI stetje ni nezmotljivo. Poznavanje sibkih tock vam pomaga odlociti, kdaj mu zaupati in kdaj preveriti rezultat.

Prekrivaajoci se in nakladani predmeti

Model vidi samo, kar je na povrsini. Predmeti, zakovani pod drugimi, so za kamero nevidni. Raziskava ICCV 2025 je potrdila, da nakladani predmeti ostajajo eden najtezjih problemov stetja.

Zelo majhni predmeti

Predmete pod priblizno 20 piksli na sliki je tezko lociti od suma. Fotografije z visjo locljivostjo pomagajo, a obstaja prakticna meja.

Goste, natrpane scene

Ko se predmeti stiskajo skupaj, lahko model zdruzi sosednje elemente v eno samo zaznavo ali spregleda predmete, stisnjene med drugimi.

Prozorni ali odsevni predmeti

Steklo, prosojna plastika in svetlece povrsine nimajo izrazitih robov, kar vodi do zgresenega ali fantomskega stetja.

Zelo velike kolicine v enem kadru

Stevila nad 1,000 v eni sami sliki ojacajo majhne napake na predmet v opazne skupne odklone. Razdelitev na vec fotografij to resi.

Kdaj rocno stetje se vedno zmaga

AI potrebuje vidne predmete na fotografiji. Obstajajo situacije, v katerih je cloveska presoja se vedno boljse orodje:

  • Manj kot 10 predmetov - Sposobnost vasih mozganov za subitizacijo naredi hiter pogled hitrejsi od katerekoli aplikacije.
  • Popolnoma skriti predmeti - Predmeti v zaprtih skatljah, za stenami ali pod drugimi predmeti so za kamero nevidni.
  • Mesane nepravilne kopice - Zmesanica zelo razlicnih predmetov v nakljucnih orientacijah lahko zmede modele, ki pricakujejo vizualno doslednost.
  • Ni kamere na voljo - Vcasih je najhitrejsa pot preprosto rocno presteti.

Prakticna locnica: ce so vsi predmeti jasno vidni in jih je vec kot priblizno 20, AI skoraj vedno zagotovi hitrejsi in natancnejsi rezultat.

Oseba drzi pametni telefon za fotografiranje majhnih elektronskih komponent, razporejenih na temni povrsini, kar prikazuje kako enostavno je steti predmete s telefonom

Zakljucek

AI stetje je danes hitrejse, natancnejse in bolj dosledno kot rocno stetje za vecino prakticnih scenarijev. Preostale omejitve so resnicne, a dobro razumljene in se zmanjsujejo z vsako novo generacijo modelov.

Naslednjic, ko se soocie s polico delov, pladnjem komponent ali paleto skatel, poskusite fotografirati namesto rocnega stetja. Odgovor boste dobili v sekundah in verjetno bo natancnejsi od vasega.