A szemed elfarad 50 csavar utan. Az AI meg csak most melegszik be.
Dolgokat kezzel szamolni egyszeru dolognak tunik, amig nem az. Nagyjabul 30 darab felett az agyad a szamlalasrol a becslese valt. Elveszited a fonalat, ujraszamolsz egy sort, es meg mindig azon tunodol, hogy jol szamoltad-e. Az AI-alapu targyaszamlalas maskepp kozelit: egyszerre dolgozza fel az egesz kepet, megjelol minden talalt elemet, es masodpercek alatt visszaadja az osszeget. Igy mukodik.
Mi tortenik, amikor feltoltesz egy fotot
Amikor egy fotot kuldesz egy AI szamlaloeszkoznek, harom dolog tortenik gyors egymasutanban.
Eloszor a rendszer elofeldolgozza a kepedet: standard meretre meretezi, normalizalja a szineket es beallitja a keporanyt. Ez ezredmasodpercekig tart.
Ezutan jon a felismeres. Egy szamitogepeslatas-modell egyetlen eloremeno passz soran vegigpazstalja az egesz kepet. A modern architekturak, mint a YOLO (You Only Look Once), racsra osztjak a kepet, es egyidejuleg becslik meg az objektumok helyzetet, osztalyozasat es megbizhatosagi pontszamat minden cellara. Gondolj ra ugy, mint a kulonbseg akozt, hogy egy oldalt szavanken olvasol, vagy az egesz oldalt egyetlen pillantassal atfogod.
Minden talalt objektumra a modell ad egy osztalyozast (mit gondol, mi az objektum), egy helyzetet (koordinatak a kepen) es egy megbizhatosagi pontszamot 0 es 1 kozott, ami jelzi a biztossagat. Egy 0.85-os ertek azt jelenti, hogy a modell 85%-ban biztos, hogy valos objektumot talalt az adott helyen.
Vegul egy megbizhatosagi kuszobertek kiszuri a gyenge felismereseket. Minden, ami a hatarertek alatt van, elvetesre kerul, csokkentve a hamis szamlalasokat. A megmaradt felismeresek osszeadasra kerulnek es szines pontokkal vagy hatologlapokkal jelennek meg az eredeti fotodon: egy vegosszeg es egy vizualis terkep arrol, hogy pontosan mit es hol szamolt meg.

A pontossagi szakadek: miert muljafelul az AI a szemedet
Az emberi latas kemeny korlattal rendelkezik, amire a legtobb ember soha nem gondol. A kognitiv tudomanyban szubitizalasnak hivjak: az agy kepes azonnal, szinte tokeletes pontossaggal felismerni 1-tol 4-ig terjedo mennyisegeket. E felett egyesevel kell szamolni, es a hibak elkezdnek beszivarodni.
Az Nventory kutatasa kimutatta, hogy a normalis munkasebessegen leltarazo emberek atlagosan 91%-os pontossagot ernek el, ami nagyjabul egy hiba minden 10 elemre. Ez a hibaarany novekedik a faradsaggal, figyelemelterelodesseI es a mennyiseggel. Mire 200 kotoelemre bamsz egy polcon, az agyad mar becsul, nem szamol.
Az AI nem farad el, nem vesziti el a fonalat es nem becsul. Egy finomhangolt YOLOv11 modell valos raktarkorulmenyek kozott tesztelve 97%-os szamlalasi pontossagot ert el tobb tesztkoros vizsgalat soran (Springer, 2026). Kontrollalt korulmenyek kozott, tiszta, jol megvilagitott kepekkel a pontossag eleri a 99%-ot. A kulonbseg csak novekedik, ahogy a mennyisegek nonek.
50 darnal az emberi es az AI szamlalasi pontossag osszemereheto. 500-nal az AI alig lassul, mikozben a hibaaranyod percrol percre novekedik. Minel nagyobb a szam, annal nagyobb az elony.
Sebesseg: percek kontra masodpercek
Egy raktaros, aki kezzel szamolja a leltart, nagyjabul 250-tol 750-ig terjedo darabot dolgoz fel orankent. Egy kozepes raktar teljes fizikai szamlalasa 1-3 napot vesz igenybe egy csapattal.
Egy AI szamlalorendszer egyetlen kepet kevesebb mint 250 ezredmasodperc alatt dolgoz fel modern hardveren. Meg okostelefonon is altalaban 1-3 masodpercet vesz igenybe. Egyetlen foto szazaval targyakat tartalmazhat, mindet egyetlen passzban szamolva.
A matematika egyertelmu. Egy feladat, amihez negy ember 8 oras munkanapja kell, nagyjabul 2,500 cikkszam, percek alatt elvegezhetove valik, ha minden polcot lefenykepezel es feldolgozol. A szuk keresztmetszet a szamlalasrol a fenykepezsere tolodik.

Hol akadozik az AI szamlalas
Az AI szamlalas nem csalhatatlan. A gyenge pontjainak ismerete segit eldonteni, mikor bizhatsz benne es mikor erdemes ellenorizni az eredmenyt.
A modell csak azt latja, ami a felszinen van. Az alattuk rejtozo elemek lathatatlanok a kamera szamara. Az ICCV 2025 kutatasa megerositette, hogy az egymasra rakott targyak az egyik legnehezebb szamlalasi problema.
A kepen nagyjabul 20 pixel alatti elemeket nehez megkulonboztetni a zajtol. A magasabb felbontasu fotok segitenek, de van egy gyakorlati hatar.
Ahogy a targyak osszezsufolodnak, a modell osszeolvaszthatja a szomszedos elemeket egyetlen felismeresbe, vagy kihagyhatja a masok koze szorult targyakat.
Az uveg, az atlatszo muanyag es a fenyes feluletek nem rendelkeznek hatarozo elekkel, ami kihagyott vagy fantom szamlalasokhoz vezet.
Az 1,000 feletti szamok egyetlen kepen felerositik a kis objekumtumkenti hibakat eszreveheto osszegekke. Tobb fotora bontva megoldhato a problema.
Mikor nyer meg a kezi szamlalas
Az AI-nak lathatao targyakra van szuksege egy fenykepen. Vannak helyzetek, amikor az emberi megiteles a jobb eszkoz:
- Kevesebb mint 10 darab - Az agyad szubitizalasi kepessege gyorsabba tesz egy gyors pillantast barmely alkalmazasnal.
- Teljesen rejtett targyak - A zart dobozokban, falak mogott vagy mas targyak alatt levo elemek lathatatlanok a kamera szamara.
- Kevert szabalytalan kupacok - A nagyon kulonbozo targyak veletlenszeru taju osszevisszasaga osszezavarhatja a vizualis kovetkezetesseget elvaaro modelleket.
- Nincs kamera - Neha a leggyorsabb ut egyszeruen kezzel szamolni.
A gyakorlati valasztvonal: ha minden targy jol lathato es tobb van beloluk nagyjabul 20-nal, az AI szinte mindig gyorsabb es pontosabb eredmenyt ad.

Osszegzes
Az AI-alapu szamlalas ma gyorsabb, pontosabb es kovetkezetesebb, mint a kezi szamlalas a legtobb gyakorlati helyzetben. A fennmarado korlatozasok valosak, de jol ismertek, es minden uj modellgeneracioval csokkennek.
Legkozelebb, amikor egy polcnyi alkatreszsel, egy talcnyi komponenssel vagy egy palettanyi dobozzal talalkozol, probald meg inkabb lefenykepezhezni, mint kezzel szamolni. Masodpercek alatt kapsz valaszt, es valoszinuleg pontosabb lesz, mint a tied.