Barcha maqolalarga qaytish

Sun'iy intellekt fotosuratlardagi obyektlarni qanday sanaydi (va nima uchun bu ishda sizdan yaxshiroq)

50 ta boltdan keyin ko'zlaringiz charchaydi. Sun'iy intellekt hammasini soniyalar ichida sanaydi va har birining ustiga rangli nuqtalar qo'yib isbotlaydi. Mana, bu aslida shunday ishlaydi.

list Ushbu maqolada

50 ta boltdan keyin ko'zlaringiz charchaydi. Sun'iy intellekt esa endigina qizib kelmoqda.

Narsalarni qo'lda sanash oddiy tuyuladi, to'g'ri kelmaguncha. Taxminan 30 ta obyektdan keyin miyangiz sanashdan taxmin qilishga o'tadi. Joyingizni yo'qotasiz, bir qatorni qayta sanaysiz va baribir to'g'ri sanab-sanamagan bo'lsangiz o'ylaysiz. Sun'iy intellekt bilan ishlaydigan obyektlarni sanash boshqacha yondashuvni qo'llaydi: butun rasmni bir vaqtda qayta ishlaydi, topgan har bir obyektni belgilaydi va jami sonini soniyalar ichida qaytaradi. Mana, shunday ishlaydi.

Fotosurat yuklagan paytingizda nima bo'ladi

Sun'iy intellekt sanash vositasiga fotosurat yuborganingizda, uchta narsa ketma-ket sodir bo'ladi.

Avval tizim rasmingizni oldindan qayta ishlaydi: standart o'lchamga o'zgartiradi, ranglarni normallaydi va tomonlar nisbatini sozlaydi. Bu millisekundlar oladi.

Keyin aniqlash bosqichi keladi. Kompyuter ko'rish modeli butun rasmni bitta oldinga o'tishda skanerlaydi. YOLO (You Only Look Once) kabi zamonaviy arxitekturalar rasmni to'r shaklida bo'ladi va har bir katak uchun obyekt joylashuvlarini, tasniflarini va ishonch ballarini bir vaqtda bashorat qiladi. Buni sahifani so'zma-so'z o'qish bilan butun sahifani bir qarashda qabul qilish orasidagi farq deb tushuning.

Model topgan har bir obyekt uchun tasnif (obyektning nima ekanini o'ylaydi), joylashuv (rasmdagi koordinatalar) va 0 dan 1 gacha bo'lgan ishonch ballini chiqaradi. 0.85 ball modelning o'sha nuqtada haqiqiy obyekt topganiga 85% ishonchli ekanligini bildiradi.

Nihoyat, ishonch chegarasi kuchsiz aniqlashlarni filtrlaydi. Chegara qiymatidan pastdagi hamma narsa olib tashlanadi va noto'g'ri sanashlar kamayadi. Qolgan aniqlashlar jamlangan holda asl fotosuratda rangli nuqtalar yoki chegara ramkalari sifatida ko'rsatiladi: umumiy son va nimani qayerda sanaganning vizual xaritasi.

Ish stolida metall boltlar, har birida yashil sun'iy intellekt aniqlash belgilari, obyektlarni sanash qatlamlarining qanday ishlashini ko'rsatadi

Aniqlik farqi: sun'iy intellekt nima uchun ko'zlaringizdan o'zib ketadi

Inson ko'rish qobiliyatining ko'pchilik o'ylamaydigan qattiq chegarasi bor. Kognitiv olimlar buni subitizing deb ataydi: miya 1 dan 4 gacha bo'lgan obyekt miqdorini deyarli mukammal aniqlikda bir lahzada taniy oladi. Bu chegaradan keyin birma-bir sanash kerak va xatolar kirib kela boshlaydi.

Nventory tadqiqoti normal ish tezligida inventarni sanaydigan odamlar o'rtacha taxminan 91% aniqlikka erishishini, ya'ni har 10 ta obyektdan birida noto'g'ri sanashini aniqladi. Bu xato darajasi charchoq, diqqatning bo'linishi va miqdorning oshishi bilan ko'tariladi. Javondagi 200 ta mahkamlagichga qaragan paytda miyangiz endi sanamaydi, taxmin qiladi.

Sun'iy intellekt charchamaydi, joyini yo'qotmaydi yoki taxmin qilmaydi. Haqiqiy ombor sharoitlarida sinovdan o'tgan aniq sozlangan YOLOv11 modeli bir necha sinov davrida 97% sanash aniqligiga erishdi (Springer, 2026). Toza, yaxshi yoritilgan rasmlar bilan nazorat qilingan sharoitda aniqlik 99% ga yetadi. Farq miqdor oshgan sari kattalashadi.

50 obyekt chegarasi

50 ta obyektda inson va sun'iy intellekt sanash aniqligi taqqoslanadigan darajada. 500 da sun'iy intellekt deyarli sekinlashmaydi, siz esa har o'tgan daqiqa bilan xato darajangiz oshadi. Son qancha katta bo'lsa, ustunlik shuncha katta.

Tezlik: daqiqalar va soniyalar

Qo'lda inventarni sanaydigan ombor ishchisi soatiga taxminan 250 dan 750 gacha obyektni qayta ishlaydi. O'rtacha omborning to'liq jismoniy sanashi bir jamoa bilan 1 dan 3 kungacha davom etadi.

Sun'iy intellekt sanash tizimi zamonaviy uskunada bitta rasmni 250 millisekunddan kam vaqtda qayta ishlaydi. Smartfonda ham odatda 1 dan 3 soniyagacha vaqt oladi. Bitta fotosuratda yuzlab obyekt bo'lishi mumkin va hammasi bitta o'tishda sanaladi.

Hisob-kitob teng emas. To'rt kishilik jamoaning 8 soatlik ish kunida bajargan vazifasi, taxminan 2,500 ta mahsulot kodi, har bir javon fotosuratga olinib qayta ishlangandan keyin daqiqalar ichida bajarilishi mumkin. To'siq sanashdan fotosuratga olishga o'tadi.

Xavfsizlik jiletini kiygan ombor ishchisi yuzlab quti bilan to'lgan baland javonlarga qarab turibdi, qo'lda inventarni sanash miqyosini ko'rsatadi

Sun'iy intellekt sanashi qiynalaydigan joylar

Sun'iy intellekt sanashi nuqsonsiz emas. Zaif tomonlarini bilish qachon ishonish va qachon natijani tekshirish kerakligini hal qilishga yordam beradi.

Ustma-ust tushgan va uyilgan obyektlar

Model faqat sirtdagilarni ko'radi. Ostida qolgan obyektlar kameraga ko'rinmaydi. ICCV 2025 tadqiqoti uyilgan obyektlar eng qiyin sanash muammolaridan biri bo'lib qolayotganini tasdiqladi.

Juda kichik obyektlar

Rasmda taxminan 20 pikseldan kichik obyektlar shovqindan ajratish qiyin bo'ladi. Yuqori sifatli fotosuratlar yordam beradi, lekin amaliy chegara bor.

Zich va tartibsiz sahnalar

Obyektlar bir-biriga yaqinlashganda, model yondosh obyektlarni bitta aniqlash sifatida birlashtirishi yoki oradagi obyektlarni o'tkazib yuborishi mumkin.

Shaffof yoki aks ettiruvchi obyektlar

Shisha, shaffof plastik va yaltiroq sirtlarda aniq chegaralar yo'q, bu o'tkazib yuborilgan yoki yolg'on sanashlarga olib keladi.

Bitta kadrdagi juda yuqori miqdorlar

Bitta rasmda 1,000 dan ortiq sanash har bir obyektga to'g'ri keladigan kichik xatolarni sezilarli jamlarga oshiradi. Bir necha fotosuratga bo'lish buni hal qiladi.

Qo'lda sanash hali ham g'olib keladigan holatlar

Sun'iy intellektga fotosuratda ko'rinadigan obyektlar kerak. Inson mulohazasi hali ham yaxshiroq vosita bo'lgan holatlar:

  • 10 tadan kam obyekt - Miyangizning subitizing qobiliyati tezkor qarashni har qanday ilovadan tezroq qiladi.
  • To'liq yashirin obyektlar - Yopiq qutilardagi, devorlar ortidagi yoki boshqa obyektlar ostidagi narsalar kameraga ko'rinmaydi.
  • Aralash tartibsiz uyumlar - Tasodifiy yo'nalishlardagi turli xil obyektlarning aralashmasi vizual izchillikni kutadigan modellarni chalkashtirib yuborishi mumkin.
  • Kamera yo'q - Ba'zan eng tez yo'l oddiy qo'lda sanashdir.

Amaliy ajratish chizig'i: barcha obyektlar aniq ko'rinsa va taxminan 20 tadan ko'p bo'lsa, sun'iy intellekt deyarli har doim tezroq va aniqroq natija beradi.

Qorong'i sirtga sochilgan kichik elektron komponentlarni fotosuratga olish uchun smartfon tutgan shaxs, telefon bilan obyektlarni sanash qanchalik oson ekanini ko'rsatadi

Xulosa

Sun'iy intellekt bilan sanash endi ko'pchilik amaliy stsenariylar uchun qo'lda sanashdan tezroq, aniqroq va barqarorroq. Qolgan cheklovlar haqiqiy, lekin yaxshi tushunilgan va har bir yangi model avlodi bilan kichrayib bormoqda.

Keyingi safar ehtiyot qismlar javoni, komponentlar patnis yoki qutlar palleti bilan to'qnashganingizda, qo'lda sanash o'rniga fotosurat olishni sinab ko'ring. Soniyalar ichida javob olasiz va ehtimol u siznikidan aniqroq bo'ladi.