Späť na všetky články

Ako AI pocita objekty na fotkach (a preco je v tom lepsia ako vy)

Vase oci sa unavia po 50 skrutkach. AI ich vsetky spocita za sekundy, s farebnymi bodkami na kazdej z nich ako dokaz. Takto to naozaj funguje.

list V tomto článku

Vase oci sa unavia po 50 skrutkach. AI sa len zahrievala.

Pocitanie veci rucne sa zda jednoduche, az kym nie je. Od priblizne 30 kusov vas mozog prechadza z pocitania na odhadovanie. Stratite prehlad, prepocitate rad a stale si nie ste isti, ci ste to mali spravne. AI pocitanie objektov postupuje inak: spracuje cely obrazok naraz, oznaci kazdy najdeny prvok a vrati celkovy sucet za sekundy. Takto to funguje.

Co sa stane, ked nahrate fotografiu

Ked poslete fotografiu do nastroja na AI pocitanie, tri veci sa stanu v rychlom slede.

Najprv system predbezne spracuje vas obrazok: zmeni velkost na standardny rozmer, normalizuje farby a upravi pomer stran. Toto trva milisekundy.

Potom prichadza detekcia. Model pocitacoveho videnia naskenuje cely obrazok v jedinom priechode. Moderne architektury ako YOLO (You Only Look Once) rozdelia obrazok na mriezku a sucasne predpovedaju pozicie objektov, klasifikacie a skore spolavlivosti pre kazdu bunku. Predstavte si to ako rozdiel medzi citanim stranky slovo po slove a vnimani celej stranky jednym pohldom.

Pre kazdy najdeny objekt model vystup klasifikaciu (co si mysli, ze objekt je), poziciu (suradnice v obrazku) a skore spolahlvosti medzi 0 a 1, ktore vyjadruje mieru istoty. Skore 0.85 znamena, ze model je na 85% presvedceny, ze na danom mieste nasiel skutocny objekt.

Napokon prahova hodnota spolahlivosti odfiltruje slabe detekcie. Vsetko pod hranicou sa zahodil, cim sa znizuju falesne pocty. Zvysne detekcie sa scitaju a zobrazia ako farebne bodky alebo ohranicujuce ramceky na vasej povodnej fotografii: celkovy pocet plus vizualna mapa toho, co bolo presne kde spocitane.

Kovove skrutky na pracovnom stole so zelenymi AI detecnymi znackami na kazdej z nich, ukazujuce ako funguju prekrytia pocitania objektov

Priepast v presnosti: preco AI prekonava vase oci

Ludske videnie ma tvrdy limit, na ktory vacsina ludi nikdy nemysli. Kognitivni vedci to nazyvaju subitizacia: mozog dokaze okamzite rozpoznat mnozstva od 1 do 4 poloziek s takmer dokonalou presnostou. Nad tymto prahom musite pocitat jeden po jednom a chyby sa zacinaju vkradat.

Vyskum spolocnosti Nventory zistil, ze ludia pocitajuci inventar pri normalnej pracovnej rychlosti dosahuju v priemere asi 91% presnost, priblizne jednu chybu na kazdych 10 poloziek. Tato chybovost stupa s unavou, rozptylenim a mnozstvom. Kym sa pozerate na 200 spojaok na polici, vas mozog hadze, nie pocita.

AI sa neunavuje, nestrata prehlad a neodhaduje. Jemne doladeny model YOLOv11 testovany v realnych skladovych podmienkach dosiahol 97% presnost pocitania napriec viacerymi kolami testovania (Springer, 2026). V kontrolovanych podmienkach s cistymi, dobre osvetlenymi obrazkami presnost dosahuje 99%. Rozdiel sa len zvacsuje s rastucimi mnozstvami.

Prahova hodnota 50 poloziek

Pri 50 polozkach je presnost pocitania cloveka a AI porovnatelna. Pri 500 sa AI sotva spomali, zatial co vasa chybovost stupa s kazdou plynucou minutou. Cim vacsi pocet, tym vacsia vyhoda.

Rychlost: minuty oproti sekundam

Skladnik rucne pocitajuci inventar spracuje priblizne 250 az 750 poloziek za hodinu. Uplna fyzicka inventura stredneho skladu trva 1 az 3 dni s timom.

System AI pocitania spracuje jeden obrazok za menej ako 250 milisekund na modernom hardveri. Aj na smartfone to zvycajne trva 1 az 3 sekundy. Jedna fotografia moze obsahovat stovky poloziek, vsetky spocitane v jedinom priechode.

Matematika je jednostranna. Uloha, na ktoru stvorclenny tim potrebuje 8-hodinovy den, priblizne 2,500 poloziek, sa da zvladnut za minuty, ak sa kazda polica odfoti a spracuje. Uske hrdlo sa presuva z pocitania na fotografovanie.

Skladnik v reflexnej veste pozerajuci nahor na vysoke police plne stoviek krabic, ukazujuci rozsah manualne inventury

Kde ma AI pocitanie problemy

AI pocitanie nie je neomylne. Poznat jeho slabe miesta vam pomaha rozhodnut sa, kedy mu verit a kedy vysledok overit.

Prekryvajuce sa a naskladane objekty

Model vidi len to, co je na povrchu. Polozky zakopaane pod spodom su pre kameru neviditelne. Vyskum ICCV 2025 potvrdil, ze naskladane objekty zostavaju jednym z najnarocnejsich problemov pocitania.

Velmi male objekty

Polozky pod priblizne 20 pixelov v obrazku je tazke odlisit od sumu. Fotografie s vyssim rozlisenim pomahaju, ale existuje prakticka hranica.

Huste, neprehladne sceny

Ked sa objekty tlacia k sebe, model moze zlucit susedne polozky do jednej detekcie alebo vynechat objekty stlacene medzi inymi.

Priehladne alebo odrazove objekty

Sklo, ciry plast a leskle povrchy nemaju vyrazne hrany, co vedie k vynechanym alebo fantomovym poctom.

Velmi vysoke mnozstva v jednom zabere

Pocty nad 1,000 v jedinom obrazku zosilnuju male chyby na objekt do citelnych celkovych odchylok. Rozdelenie na viacero fotografii tento problem riesi.

Kedy rucne pocitanie stale vyhrava

AI potrebuje viditelne objekty na fotografii. Su situacie, kedy je ludsky usudok stale lepsim nastrojom:

  • Menej ako 10 poloziek - Schopnost vasho mozgu subitizovat robi rychly pohlad rychlejsim ako akakolvek aplikacia.
  • Uplne skryte objekty - Polozky v zatvorenych krabiciach, za stenami alebo pod inymi predmetmi su pre kameru neviditelne.
  • Zmiesane nepravidelne kopy - Zmes velmi roznych objektov v nahodnych orientaciach moze zmast modely, ktore ocakavaju vizualnu konzistenciu.
  • Ziadna kamera k dispozicii - Niekedy je najrychlejsia cesta jednoducho pocitat rucne.

Prakticka delicacia ciara: ak su vsetky objekty jasne viditelne a je ich viac ako priblizne 20, AI takmer vzdy dodava rychlejsi a presnejsi vysledok.

Osoba drziaca smartfon na odfotenie malych elektronickych suciastok rozlozenych na tmavom povrchu, ukazujuce ako jednoducho sa daju pocitat objekty telefonom

Zaver

AI pocitanie je dnes rychlejsie, presnejsie a konzistentnejsie ako rucne pocitanie pre vacsinu praktickych scenraov. Zostadvajuce obmedzenia su realne, ale dobre zname a zmensuju sa s kazdou novou generaciou modelov.

Nabuduce, ked budete stbat pred policou plnou dielov, podnosom komponentov alebo paletou krabic, skuste to odfotit namiesto rucneho pocitania. Odpoved dostanete za sekundy a pravdepodobne bude presnejsia ako vasa.