Macho yako yanachoka baada ya skrubu 50. AI ndiyo inaanza kupata kasi.
Kuhesabu vitu kwa mkono kunaonekana rahisi hadi isipokuwa hivyo. Zaidi ya vitu 30, ubongo wako unabadilika kutoka kuhesabu kwenda kukadiria. Unapoteza nafasi yako, unahesabu tena safu, na bado unashangaa kama umepata jibu sahihi. Uhesabuji wa vitu unaotumia AI unatumia njia tofauti: unachakata picha nzima mara moja, unaweka alama kwenye kila kitu kinachopata, na unarudisha jumla kwa sekunde. Hivi ndivyo inavyofanya kazi.
Nini kinatokea unapopakia picha
Unapotuma picha kwa zana ya kuhesabu ya AI, mambo matatu yanatokea kwa mfuatano wa haraka.
Kwanza, mfumo unachakata picha yako awali: kubadilisha ukubwa hadi kipimo cha kawaida, kusawazisha rangi, na kurekebisha uwiano wa pande. Hii inachukua millisekunde.
Kisha inakuja hatua ya utambuzi. Modeli ya computer vision inachunguza picha nzima kwa kupita mara moja. Miundo ya kisasa kama YOLO (You Only Look Once) inagawanya picha kwenye gridi na kutabiri maeneo ya vitu, uainishaji, na alama za uhakika kwa kila seli kwa wakati mmoja. Fikiria kama tofauti kati ya kusoma ukurasa neno kwa neno na kuona ukurasa mzima kwa mtazamo mmoja.
Kwa kila kitu ambacho modeli inapata, inatoa uainishaji (kinachofikiria kitu ni nini), eneo (viwianishi kwenye picha), na alama ya uhakika kati ya 0 na 1 inayoonyesha jinsi inavyokuwa na uhakika. Alama ya 0.85 inamaanisha modeli ina uhakika wa 85% kwamba imepata kitu halisi mahali hapo.
Hatimaye, kizingiti cha uhakika kinachuja utambuzi dhaifu. Chochote chini ya kiwango kinachotupwa, kupunguza hesabu za uongo. Utambuzi uliobaki unajumlishwa na kuonyeshwa kama vitone vya rangi au masanduku ya mipaka kwenye picha yako ya awali: jumla ya hesabu pamoja na ramani ya kuona ya nini kilihesabiwa na wapi.

Pengo la usahihi: kwa nini AI inashinda macho yako
Uwezo wa kuona wa binadamu una kikomo ambacho watu wengi hawafikirii kamwe. Wanasayansi wa utambuzi wanakiita subitizing: ubongo unaweza kutambua mara moja idadi ya vitu 1 hadi 4 kwa usahihi karibu kamili. Zaidi ya kiwango hicho, lazima uhesabu moja kwa moja, na makosa yanaanza kuingia.
Utafiti kutoka Nventory uligundua kwamba wanadamu wanaohesabu hesabu ya bidhaa kwa kasi ya kawaida ya kazi wana usahihi wa wastani wa 91%, takriban kosa moja kwa kila vitu 10. Kiwango hicho cha makosa kinapanda na uchovu, usumbufu, na wingi. Wakati unatazama vifaa 200 kwenye rafu, ubongo wako unakisia, hauhesabu.
AI haichoki, haipotezi nafasi yake, wala haikadiri. Modeli ya YOLOv11 iliyorekebishwa vizuri iliyojaribiwa katika hali halisi ya ghala ilifikia usahihi wa kuhesabu wa 97% katika raundi nyingi za majaribio (Springer, 2026). Chini ya hali zilizodhibitiwa na picha safi zenye mwanga mzuri, usahihi unafikia 99%. Pengo linazidi kuongezeka kadri idadi inavyoongezeka.
Kwa vitu 50, usahihi wa kuhesabu wa binadamu na AI ni sawa. Kwa 500, AI haipunguzi kasi wakati kiwango chako cha makosa kinapanda kwa kila dakika inayopita. Kadri hesabu inavyokuwa kubwa, ndivyo faida inavyokuwa kubwa.
Kasi: dakika dhidi ya sekunde
Mfanyakazi wa ghala anayehesabu bidhaa kwa mkono anachakata takriban vitu 250 hadi 750 kwa saa. Hesabu kamili ya ghala la kati inachukua siku 1 hadi 3 na timu.
Mfumo wa kuhesabu wa AI unachakata picha moja kwa chini ya millisekunde 250 kwenye vifaa vya kisasa. Hata kwenye simu ya mkononi, kawaida inachukua sekunde 1 hadi 3. Picha moja inaweza kuwa na mamia ya vitu, vyote vilivyohesabiwa kwa kupita mara moja.
Hesabu haiko sawa. Kazi inayochukua timu ya watu wanne siku ya saa 8, takriban bidhaa 2,500, inaweza kukamilishwa kwa dakika wakati kila rafu inapigwa picha na kuchakatwa. Kikwazo kinabadilika kutoka kuhesabu kwenda kupiga picha.

Ambapo uhesabuji wa AI unakabiliwa na changamoto
Uhesabuji wa AI si kamili. Kujua mapungufu yake kunakusaidia kuamua lini kuuamini na lini kuthibitisha matokeo.
Modeli inaona tu kile kilicho juu ya uso. Vitu vilivyofichwa chini havionekani kwa kamera. Utafiti wa ICCV 2025 ulithibitisha kuwa vitu vilivyorundikwa vinabaki kuwa mojawapo ya matatizo magumu zaidi ya kuhesabu.
Vitu chini ya takriban pikseli 20 kwenye picha vinakuwa vigumu kutofautisha na kelele. Picha za ubora wa juu zinasaidia, lakini kuna kikomo cha vitendo.
Vitu vinapojisongamana, modeli inaweza kuunganisha vitu vya jirani kuwa utambuzi mmoja au kukosa vitu vilivyobana kati ya vingine.
Kioo, plastiki ya uwazi, na nyuso zenye kung'aa hazina kingo dhahiri, na kusababisha hesabu zilizokosekana au za udanganyifu.
Hesabu zaidi ya 1,000 kwenye picha moja zinakuza makosa madogo kwa kila kitu kuwa jumla inayoonekana. Kugawanya kwenye picha nyingi kunatatua hili.
Wakati kuhesabu kwa mkono bado kunashinda
AI inahitaji vitu vinavyoonekana kwenye picha. Kuna hali ambapo uamuzi wa binadamu bado ni zana bora:
- Chini ya vitu 10 - Uwezo wa subitizing wa ubongo wako unafanya mtazamo wa haraka kuwa wa kasi zaidi kuliko programu yoyote.
- Vitu vilivyofichwa kabisa - Vitu ndani ya masanduku yaliyofungwa, nyuma ya kuta, au chini ya vitu vingine havionekani kwa kamera.
- Marundo mchanganyiko yasiyo na mpangilio - Mchanganyiko wa vitu tofauti sana katika mielekeo ya nasibu unaweza kuchanganya modeli zinazotarajia uthabiti wa kuona.
- Hakuna kamera inayopatikana - Wakati mwingine njia ya haraka zaidi ni kuhesabu kwa mkono tu.
Mpaka wa vitendo: ikiwa vitu vyote vinaonekana wazi na kuna zaidi ya takriban 20, AI karibu kila wakati inatoa matokeo ya haraka na sahihi zaidi.

Hitimisho
Uhesabuji unaotumia AI sasa ni wa kasi zaidi, sahihi zaidi, na thabiti zaidi kuliko kuhesabu kwa mkono kwa hali nyingi za vitendo. Mapungufu yaliyobaki ni ya kweli lakini yanaeleweka vizuri, na yanapungua kwa kila kizazi kipya cha modeli.
Wakati mwingine unapokabiliwa na rafu ya vipuri, trei ya vipengele, au paleti ya masanduku, jaribu kupiga picha badala ya kuhesabu kwa mkono. Utapata jibu kwa sekunde, na labda litakuwa sahihi zaidi kuliko lako.