Atpakaļ uz visiem rakstiem

Ka MI skaita objektus fotoattelos (un kapec tas to dara labak neka tu)

Jusu acis nogurst pec 50 skruvem. MI tos visus saskaita dazas sekundes, ar krasainiem punktiem uz katra ka pieradijumu. Luuk, ka tas patiesam darbojas.

list Šajā rakstā

Jusu acis nogurst pec 50 skruvem. MI tikai sak iesilt.

Lietu skaitisana ar rokam skiet vienkarse, lidz tas vairs ta nav. Pec aptuveni 30 vienibam jusu smadzenes pariet no skaitisanas uz apmeram. Jus pazaudetat vietu, parskaitiet rindu un joprojam domajat, vai rezultats ir pareizs. MI objektu skaitisana pieiet citadi: ta apstrada visu attelu uzreiz, atzime katru atrasto vienumu un dazas sekundes atgriez kopejo skaitu. Luuk, ka tas darbojas.

Kas notiek, kad augsuploadeejat foto

Kad nosutiet foto MI skaitisanas rikom, atra seciba notiek tris lietas.

Vispirms sistema apstrada jusu attelu: maina izmeru uz standarta dimensiju, normalize krasas un pielago malu attiecibu. Tas aiznem milisekundes.

Tad seko noteuksana. Datorredzes modelis skenee visu attelu viena pieeja. Modernaas arhitekturas, piemeram, YOLO (You Only Look Once), sadala attelu rezgi un vienlaikus prognozee objektu atrasanas vietas, klasifikacijas un ticamibas rezultatus katrai sunai. Iedomajieties atskiribu starp lapas lasisanu vardu pa vardam un visas lapas uztversanu viena acumirkli.

Katram atrastajam objektam modelis izvada klasifikaciju (ko tas uzskata par objektu), atrasanas vietu (koordinatas attela) un ticamibas rezultatu no 0 lidz 1, kas norada, cik parliecinats tas ir. Rezultats 0.85 nozime, ka modelis ir 85% parliecinats, ka si vieta ir atradis istu objektu.

Visbeidzot ticamibas slieksnis izfiltre vajas noteuksanas. Viss, kas ir zem robezvertibas, tiek atmests, samazinot kludainu skaitijumu skaitu. Atlikusas noteuksanas tiek summetas un attielotas ka krasaini punkti vai ierobezojosa ramji uz jusu originalas fotoattela: kopejais skaits plus vizuala karte par to, kas tieši tika skaitits un kur.

Metala skruves uz darbagalda ar zaliem MI noteuksanas markeriem uz katras, raadot ka darbojas objektu skaitisanas parklajums

Precizitates atskiiriba: kapec MI parspej jusu acis

Cilveka redzei ir stingra robeza, par kuru lielaka dala cilveku nekad nedomaa. Kognitivie zinatnieki to sauc par subitizaciju: smadzenes var uzreiz atpazit daudzumus no 1 lidz 4 vienibam ar gandrriz idealu precizitati. Virs si slieksna japec pa vienai, un kludas sak paradzities.

Nventory petijums atklaja, ka cilveki, kas skaita krajumus normala darba atruma, videzi sasniedz aptuveni 91% precizitati - aptuveni viena kluda uz katriem 10 objektiem. Si kludu likme pieaug lidz ar nogurumu, uzmanibas novirzisanu un daudzumu. Kad skataties uz 200 stiprinajuma detalaam plaukta, jusu smadzenes min, nevis skaita.

MI nenogurst, nepazaude vietu un nemine. Precizi noreguleets YOLOv11 modelis, kas testets realos noliktavas apstaklos, sasniedza 97% skaitisanas precizitati vairakas testesanas kartas (Springer, 2026). Kontroletos apstaklos ar tiiriem, labi apgaismotiem atteliem precizitate sasniedz 99%. Atskiriiba tikai pieaug, pieaugot daudzumiem.

50 vieniibu slieksnis

Pie 50 vienibam cilveka un MI skaitisanas precizitate ir salidzinama. Pie 500 MI tikko paleninaas, kameer jusu kludu likme pieaug ar katru aizritoso minuti. Jo lielaks skaits, jo lielaka prieksrociiba.

Atrums: minutes pret sekundem

Noliktavas darbinieks, kas manuali skaita krajumus, apstrada aptuveni 250 lidz 750 vienibas stunda. Pilna fiziska videjas noliktavas skaitisana ar komandu aiznem 1 lidz 3 dienas.

MI skaitisanas sistema apstrada vienu attelu mazak neka 250 milisekundees uz modernas aparaturas. Pat viedtaalruni tas parasti aiznem 1 lidz 3 sekundes. Viena fotoattela var but simtiem vieniibu, kas visas saskaititas viena pieeja.

Matematiika ir vienpusiga. Uzdevums, kam cetru cilveku komandai vajadziga 8 stundu darba diena - aptuveni 2,500 precu vienibas - var tikt paveikts dazas minutes, ja katrs plaukts tiek nofotografets un apstradats. Sauraka vieta parviietojas no skaitisanas uz fotografesanu.

Noliktavas darbinieks drosibas veste, kas skatias uz augstiem plauktiem, pilniem ar simtiem kastu, paradot manualas krajumu skaitisanas apjomu

Kur MI skaitisanai ir grutibas

MI skaitisana nav nekldigaa. Zinot tas vajas vietas, juums paliidz izlemt, kad tai uzticeeties un kad parbaaudit rezultatu.

Parklajosies un sakrauti objekti

Modelis redz tikai to, kas ir virspuse. Zem apaksas pasleptie objekti kamerai ir neredzami. ICCV 2025 petijums apstiprinaja, ka sakrauti objekti joprojam ir viena no grutakajam skaitisanas problemam.

Loti mazi objekti

Objekti, kas ir mazaki par aptuveni 20 pikseliem attela, klust gruti atskirami no trokšna. Augstikas izškirtspejas foto paliidz, bet ir praktisks ierobezojums.

Blivas, parbliveetas ainas

Kad objekti sagruuzas kopa, modelis var apvienot blakus esosus objektus viena noteikšana vai palaiist garaam starp citiem iespiestas vieniibas.

Caurspidiigi vai atstarojoši objekti

Stikls, caurspidiiga plastmasa un spiidigaas virsmas nav izteiktu malu, kas noved pie izlaistiem vai fantoma skaitijumiem.

Loti lieli daudzumi viena kadra

Skaitijumi virs 1,000 viena attela pastiprina mazas kludas katram objektam lidz manaamiem kopejiem rezultatiem. Sadalijums vairakaas fotoatteelos to atrisina.

Kad skaitisana ar rokam joprojam uzvar

MI nepieciesami redzami objekti fotoattela. Ir situacijas, kad cilveka spriedums ir labaks riks:

  • Mazak neka 10 objekti - Jusu smadzenu subitizacijas speeja padara atru skatienu atrak neka jebkura lietotne.
  • Pilniigi pasleptus objekti - Objekti aizveertas kastes, aiz sienam vai zem citiem objektiem kamerai ir neredzami.
  • Jauktas neregularas kaudzes - Loti atskirigu objektu juceklis nejauša orientacija var mulsinat modelus, kas gaida vizualu konsekvenci.
  • Nav pieejama kamera - Dazreiz atrakais ceels ir vienkarsi saskaitit ar rokam.

Praktiska robeezliniija: ja visi objekti ir skaidri redzami un to ir vairak neka aptuveni 20, MI gandrriz vienmeer sniedz atrak un precizak rezultatu.

Cilveks tur viedtalruni, fotografejot mazas elektroniskas detalas, kas izkaisitas uz tumsa virsmas, paradot cik viegli ir saskaitit objektus ar talruni

Secinajums

MI skaitisana tagad ir atraka, precizaka un konsekventaka neka manuala skaitisana lielaka dala praktisko scenariju. Atlikusie ierobezojumi ir reali, bet labi saprotami, un tie saruk ar katru jauno modelu paaudzi.

Nakamreiz, kad saskarsieties ar plauktu, pilnu detalu, paliktni ar komponentiem vai paleti ar kastem, meeginiet nofotografet, nevis skaitit ar rokam. Atbildi sanemssiet dazas sekundes, un ta droši vien bus precizaka neka jusu.