Tilbake til alle artikler

Hvordan AI teller objekter i bilder (og hvorfor den er bedre enn deg)

Oynene dine blir trette etter 50 bolter. AI teller alle paa noen sekunder, med fargede prikker paa hver enkelt som bevis. Slik fungerer det faktisk.

list I denne artikkelen

Oynene dine blir trette etter 50 bolter. AI har bare saa vidt begynt.

Aa telle ting for haand foeles enkelt til det ikke gjor det lenger. Etter omtrent 30 gjenstander gaar hjernen fra aa telle til aa anslaa. Du mister oversikten, teller en rad paa nytt og lurer fortsatt paa om du fikk rett. AI-drevet objekttelling tar en annen tilnaerming: den behandler hele bildet paa en gang, markerer hver gjenstand den finner og returnerer et totalantall paa noen sekunder. Slik fungerer det.

Hva som skjer naar du laster opp et bilde

Naar du sender et bilde til et AI-telleverktoy, skjer tre ting i rask rekkefolge.

Forst forbehandler systemet bildet ditt: endrer storrelse til en standarddimensjon, normaliserer farger og justerer sideforholdet. Dette tar millisekunder.

Deretter kommer deteksjonen. En computer vision-modell skanner hele bildet i en enkelt gjennomgang. Moderne arkitekturer som YOLO (You Only Look Once) deler bildet inn i et rutenett og forutsier objektplasseringer, klassifiseringer og konfidensverdier for hver celle samtidig. Tenk paa det som forskjellen mellom aa lese en side ord for ord og aa ta inn hele siden i et blikk.

For hvert objekt modellen finner, gir den en klassifisering (hva den tror objektet er), en plassering (koordinater i bildet) og en konfidensverdi mellom 0 og 1 som representerer hvor sikker den er. En verdi paa 0.85 betyr at modellen er 85 % sikker paa at den fant et virkelig objekt paa det stedet.

Til slutt filtrerer en konfidensterskel bort svake deteksjoner. Alt under grensen forkastes, noe som reduserer falske tellinger. De gjenvaerende deteksjonene summeres og vises som fargede prikker eller markeringsrammer paa originalbildet ditt: et totalantall pluss et visuelt kart over noyaktig hva som ble talt og hvor.

Metal bolts on a workbench with green AI detection markers on each one, showing how object counting overlays work

Noyaktighetsgapet: hvorfor AI utkonkurrerer oynene dine

Menneskelig syn har en hard grense de fleste aldri tenker over. Kognitive forskere kaller det subitizing: hjernen kan oeyeblikkelig gjenkjenne mengder fra 1 til 4 gjenstander med naermest perfekt noyaktighet. Over den terskelen maa du telle en og en, og feil begynner aa snike seg inn.

Forskning fra Nventory fant at mennesker som teller varelager i normalt arbeidstempo i gjennomsnitt oppnaar omtrent 91 % noyaktighet, omtrent en feiltelling per 10 gjenstander. Feilraten oker med tretthet, distraksjoner og antall. Naar du stirrer paa 200 festemidler paa en hylle, gjetter hjernen din, den teller ikke.

AI blir ikke trott, mister ikke oversikten og anslaar ikke. En finjustert YOLOv11-modell testet under virkelige lagerforhold oppnaadde 97 % tellenoyaktighet over flere testrunder (Springer, 2026). Under kontrollerte forhold med rene, godt belyste bilder naar noyaktigheten 99 %. Gapet bare oker ettersom antallene vokser.

Terskelen paa 50 gjenstander

Ved 50 gjenstander er tellenoyaktigheten for mennesker og AI sammenlignbar. Ved 500 bremser AI knapt ned mens feilraten din stiger for hvert minutt. Jo hoyere antallet, desto storre fordel.

Hastighet: minutter mot sekunder

En lagerarbeider som manuelt teller varelager behandler omtrent 250 til 750 gjenstander per time. En full fysisk opptelling av et middels stort lager tar 1 til 3 dager med et team.

Et AI-tellesystem behandler et enkelt bilde paa under 250 millisekunder paa moderne maskinvare. Selv paa en smarttelefon tar det vanligvis 1 til 3 sekunder. Ett bilde kan inneholde hundrevis av gjenstander, alle talt i en enkelt gjennomgang.

Regnestykket er skjevt. En oppgave som tar et team paa fire personer en 8-timers dag, omtrent 2,500 SKU-er, kan gjennomfores paa minutter naar hver hylle fotograferes og behandles. Flaskehalsen flytter seg fra telling til fotografering.

Warehouse worker in safety vest looking up at tall shelves stacked with hundreds of boxes, showing the scale of manual inventory counting

Hvor AI-telling sliter

AI-telling er ikke ufeilbarlig. Aa kjenne til svake punkter hjelper deg med aa avgjore naar du kan stole paa den og naar du bor verifisere resultatet.

Overlappende og stablede objekter

Modellen ser bare det som er paa overflaten. Gjenstander begravd under andre er usynlige for kameraet. Forskning fra ICCV 2025 bekreftet at stablede objekter fortsatt er et av de vanskeligste telleproblemene.

Svart smaa objekter

Gjenstander under omtrent 20 piksler i bildet blir vanskelige aa skille fra stoy. Bilder med hoyere opplosning hjelper, men det finnes en praktisk grense.

Tette, rotete scener

Naar objekter klumper seg sammen, kan modellen sla sammen naboobjekter til en deteksjon eller gaa glipp av gjenstander klemt mellom andre.

Gjennomsiktige eller reflekterende gjenstander

Glass, klar plast og blanke overflater mangler tydelige kanter, noe som forer til tapte eller fantomtellinger.

Svart hoye antall i ett bilde

Tellinger over 1,000 i et enkelt bilde forsterker smaa feil per objekt til merkbare totaler. Aa dele opp i flere bilder loser dette.

Naar manuell telling fortsatt vinner

AI trenger synlige objekter i et fotografi. Det finnes situasjoner der menneskelig vurdering fortsatt er det bedre verktoeyet:

  • Faerre enn 10 gjenstander - Hjernens subitizing-evne gjor at et raskt blikk er raskere enn noen app.
  • Helt skjulte objekter - Gjenstander inne i lukkede esker, bak vegger eller under andre gjenstander er usynlige for et kamera.
  • Blandede uregelmessige hauger - Et virvar av svart ulike objekter i tilfeldige retninger kan forvirre modeller som forventer visuell konsistens.
  • Ikke noe kamera tilgjengelig - Noen ganger er den raskeste veien rett og slett aa telle for haand.

Den praktiske skillelinjen: hvis alle objekter er tydelig synlige og det er mer enn omtrent 20 av dem, leverer AI nesten alltid et raskere og mer noyaktig resultat.

Person holding a smartphone to photograph small electronic components spread on a dark surface, showing how easy it is to count objects with a phone

Konklusjonen

AI-drevet telling er naa raskere, mer noyaktig og mer konsekvent enn manuell telling i de fleste praktiske scenarier. De gjenvaerende begrensningene er reelle, men godt forstaaatte, og de krymper med hver nye modellgenerasjon.

Neste gang du staar foran en hylle med deler, et brett med komponenter eller en pall med esker, prov aa ta et bilde i stedet for aa telle for haand. Du faar et svar paa noen sekunder, og det er sannsynligvis mer noyaktig enn ditt.