Jinsi AI Inavyohesabu Vitu kwenye Picha (Na Kwa Nini Inakushinda)

Macho yako yanachoka baada ya skrubu 50. AI ndiyo inaanza kupata kasi.

Kuhesabu vitu kwa mkono kunaonekana rahisi hadi isipokuwa hivyo. Zaidi ya vitu 30, ubongo wako unabadilika kutoka kuhesabu kwenda kukadiria. Unapoteza nafasi yako, unahesabu tena safu, na bado unashangaa kama umepata jibu sahihi. Uhesabuji wa vitu unaotumia AI unatumia njia tofauti: unachakata picha nzima mara moja, unaweka alama kwenye kila kitu kinachopata, na unarudisha jumla kwa sekunde. Hivi ndivyo inavyofanya kazi.

Nini kinatokea unapopakia picha

Unapotuma picha kwa zana ya kuhesabu ya AI, mambo matatu yanatokea kwa mfuatano wa haraka.

Kwanza, mfumo unachakata picha yako awali: kubadilisha ukubwa hadi kipimo cha kawaida, kusawazisha rangi, na kurekebisha uwiano wa pande. Hii inachukua millisekunde.

Kisha inakuja hatua ya utambuzi. Modeli ya computer vision inachunguza picha nzima kwa kupita mara moja. Miundo ya kisasa kama YOLO (You Only Look Once) inagawanya picha kwenye gridi na kutabiri maeneo ya vitu, uainishaji, na alama za uhakika kwa kila seli kwa wakati mmoja. Fikiria kama tofauti kati ya kusoma ukurasa neno kwa neno na kuona ukurasa mzima kwa mtazamo mmoja.

Kwa kila kitu ambacho modeli inapata, inatoa uainishaji (kinachofikiria kitu ni nini), eneo (viwianishi kwenye picha), na alama ya uhakika kati ya 0 na 1 inayoonyesha jinsi inavyokuwa na uhakika. Alama ya 0.85 inamaanisha modeli ina uhakika wa 85% kwamba imepata kitu halisi mahali hapo.

Hatimaye, kizingiti cha uhakika kinachuja utambuzi dhaifu. Chochote chini ya kiwango kinachotupwa, kupunguza hesabu za uongo. Utambuzi uliobaki unajumlishwa na kuonyeshwa kama vitone vya rangi au masanduku ya mipaka kwenye picha yako ya awali: jumla ya hesabu pamoja na ramani ya kuona ya nini kilihesabiwa na wapi.

Skrubu za chuma kwenye meza ya kazi zenye alama za kijani za utambuzi wa AI kwenye kila moja, zikionyesha jinsi uwekaji wa alama za kuhesabu vitu unavyofanya kazi

Pengo la usahihi: kwa nini AI inashinda macho yako

Uwezo wa kuona wa binadamu una kikomo ambacho watu wengi hawafikirii kamwe. Wanasayansi wa utambuzi wanakiita subitizing: ubongo unaweza kutambua mara moja idadi ya vitu 1 hadi 4 kwa usahihi karibu kamili. Zaidi ya kiwango hicho, lazima uhesabu moja kwa moja, na makosa yanaanza kuingia.

Utafiti kutoka Nventory uligundua kwamba wanadamu wanaohesabu hesabu ya bidhaa kwa kasi ya kawaida ya kazi wana usahihi wa wastani wa 91%, takriban kosa moja kwa kila vitu 10. Kiwango hicho cha makosa kinapanda na uchovu, usumbufu, na wingi. Wakati unatazama vifaa 200 kwenye rafu, ubongo wako unakisia, hauhesabu.

AI haichoki, haipotezi nafasi yake, wala haikadiri. Modeli ya YOLOv11 iliyorekebishwa vizuri iliyojaribiwa katika hali halisi ya ghala ilifikia usahihi wa kuhesabu wa 97% katika raundi nyingi za majaribio (Springer, 2026). Chini ya hali zilizodhibitiwa na picha safi zenye mwanga mzuri, usahihi unafikia 99%. Pengo linazidi kuongezeka kadri idadi inavyoongezeka.

Kizingiti cha vitu 50

Kwa vitu 50, usahihi wa kuhesabu wa binadamu na AI ni sawa. Kwa 500, AI haipunguzi kasi wakati kiwango chako cha makosa kinapanda kwa kila dakika inayopita. Kadri hesabu inavyokuwa kubwa, ndivyo faida inavyokuwa kubwa.

Kasi: dakika dhidi ya sekunde

Mfanyakazi wa ghala anayehesabu bidhaa kwa mkono anachakata takriban vitu 250 hadi 750 kwa saa. Hesabu kamili ya ghala la kati inachukua siku 1 hadi 3 na timu.

Mfumo wa kuhesabu wa AI unachakata picha moja kwa chini ya millisekunde 250 kwenye vifaa vya kisasa. Hata kwenye simu ya mkononi, kawaida inachukua sekunde 1 hadi 3. Picha moja inaweza kuwa na mamia ya vitu, vyote vilivyohesabiwa kwa kupita mara moja.

Hesabu haiko sawa. Kazi inayochukua timu ya watu wanne siku ya saa 8, takriban bidhaa 2,500, inaweza kukamilishwa kwa dakika wakati kila rafu inapigwa picha na kuchakatwa. Kikwazo kinabadilika kutoka kuhesabu kwenda kupiga picha.

Mfanyakazi wa ghala aliyevaa koti la usalama akitazama juu kwenye rafu ndefu zilizojaa mamia ya masanduku, akionyesha kiwango cha kuhesabu bidhaa kwa mkono

Ambapo uhesabuji wa AI unakabiliwa na changamoto

Uhesabuji wa AI si kamili. Kujua mapungufu yake kunakusaidia kuamua lini kuuamini na lini kuthibitisha matokeo.

Vitu vinavyoingiliana na kurundikwa

Modeli inaona tu kile kilicho juu ya uso. Vitu vilivyofichwa chini havionekani kwa kamera. Utafiti wa ICCV 2025 ulithibitisha kuwa vitu vilivyorundikwa vinabaki kuwa mojawapo ya matatizo magumu zaidi ya kuhesabu.

Vitu vidogo sana

Vitu chini ya takriban pikseli 20 kwenye picha vinakuwa vigumu kutofautisha na kelele. Picha za ubora wa juu zinasaidia, lakini kuna kikomo cha vitendo.

Mandhari yenye vitu vingi vilivyosongamana

Vitu vinapojisongamana, modeli inaweza kuunganisha vitu vya jirani kuwa utambuzi mmoja au kukosa vitu vilivyobana kati ya vingine.

Vitu vya uwazi au vinavyoakisi

Kioo, plastiki ya uwazi, na nyuso zenye kung'aa hazina kingo dhahiri, na kusababisha hesabu zilizokosekana au za udanganyifu.

Idadi kubwa sana kwenye fremu moja

Hesabu zaidi ya 1,000 kwenye picha moja zinakuza makosa madogo kwa kila kitu kuwa jumla inayoonekana. Kugawanya kwenye picha nyingi kunatatua hili.

Wakati kuhesabu kwa mkono bado kunashinda

AI inahitaji vitu vinavyoonekana kwenye picha. Kuna hali ambapo uamuzi wa binadamu bado ni zana bora:

Chini ya vitu 10 - Uwezo wa subitizing wa ubongo wako unafanya mtazamo wa haraka kuwa wa kasi zaidi kuliko programu yoyote.
Vitu vilivyofichwa kabisa - Vitu ndani ya masanduku yaliyofungwa, nyuma ya kuta, au chini ya vitu vingine havionekani kwa kamera.
Marundo mchanganyiko yasiyo na mpangilio - Mchanganyiko wa vitu tofauti sana katika mielekeo ya nasibu unaweza kuchanganya modeli zinazotarajia uthabiti wa kuona.
Hakuna kamera inayopatikana - Wakati mwingine njia ya haraka zaidi ni kuhesabu kwa mkono tu.

Mpaka wa vitendo: ikiwa vitu vyote vinaonekana wazi na kuna zaidi ya takriban 20, AI karibu kila wakati inatoa matokeo ya haraka na sahihi zaidi.

Mtu akishika simu ya mkononi kupiga picha ya vipengele vidogo vya kielektroniki vilivyotawanyika kwenye uso mweusi, akionyesha jinsi ilivyo rahisi kuhesabu vitu kwa simu

Hitimisho

Uhesabuji unaotumia AI sasa ni wa kasi zaidi, sahihi zaidi, na thabiti zaidi kuliko kuhesabu kwa mkono kwa hali nyingi za vitendo. Mapungufu yaliyobaki ni ya kweli lakini yanaeleweka vizuri, na yanapungua kwa kila kizazi kipya cha modeli.

Wakati mwingine unapokabiliwa na rafu ya vipuri, trei ya vipengele, au paleti ya masanduku, jaribu kupiga picha badala ya kuhesabu kwa mkono. Utapata jibu kwa sekunde, na labda litakuwa sahihi zaidi kuliko lako.

Uhesabuji wa AI Computer Vision Utambuzi wa Vitu Jinsi Inavyofanya Kazi

Jinsi AI Inavyohesabu Vitu kwenye Picha (Na Kwa Nini Inakushinda)

Nini kinatokea unapopakia picha

Pengo la usahihi: kwa nini AI inashinda macho yako

Kasi: dakika dhidi ya sekunde

Ambapo uhesabuji wa AI unakabiliwa na changamoto

Wakati kuhesabu kwa mkono bado kunashinda

Hitimisho

Unaweza pia kupenda

Kuhesabu kwa Mkono dhidi ya AI: Lini Kuiamini Algorithm

Hesabu paneli za jua kutoka picha za drone kwa AI

Kuhesabu magogo kwa AI: hesabu ya haraka kwenye yadi ya mbao