Барлық мақалаларға оралу

Жасанды интеллект фотосуреттердегі нысандарды қалай санайды (және неге бұл істе сізден жақсы)

50 болттан кейін көздеріңіз шаршайды. Жасанды интеллект барлығын секундтар ішінде санайды, әрқайсысына түрлі-түсті нүктелер қойып дәлелдейді. Міне, бұл шын мәнінде осылай жұмыс істейді.

list Бұл мақалада

50 болттан кейін көздеріңіз шаршайды. Жасанды интеллект енді ғана қызып келеді.

Затларды қолмен санау қарапайым көрінеді, бірақ олай емес. Шамамен 30 нысаннан кейін миыңыз санаудан болжауға ауысады. Орныңызды жоғалтасыз, бір қатарды қайта санайсыз және дұрыс санап-санамағаныңызды ойлайсыз. Жасанды интеллектпен жұмыс істейтін нысанды санау басқа тәсілді қолданады: бүкіл кескінді бір уақытта өңдейді, тапқан әрбір нысанды белгілейді және жиынтығын секундтар ішінде қайтарады. Міне, осылай жұмыс істейді.

Фотосурет жүктегенде не болады

Жасанды интеллект санау құралына фотосурет жібергенде, үш нәрсе тез арада орын алады.

Алдымен жүйе кескініңізді алдын ала өңдейді: стандартты өлшемге өзгертеді, түстерді қалыпқа келтіреді және пропорциясын реттейді. Бұл миллисекундтар алады.

Содан кейін анықтау кезеңі басталады. Компьютерлік көру моделі бүкіл кескінді бір тікелей өтуде сканерлейді. YOLO (You Only Look Once) сияқты заманауи архитектуралар кескінді тор түрінде бөледі және әрбір ұяшық үшін нысан орналасуларын, жіктемелерін және сенімділік ұпайларын бір уақытта болжайды. Мұны бетті сөзбе-сөз оқу мен бүкіл бетті бір қарағанда қабылдау арасындағы айырмашылық деп түсініңіз.

Модель тапқан әрбір нысан үшін жіктеме (нысанның не екенін ойлайды), орналасу (кескіндегі координаталар) және 0 мен 1 арасындағы сенімділік ұпайын шығарады. 0.85 ұпайы модельдің сол нүктеде нақты нысан тапқанына 85% сенімді екенін білдіреді.

Соңында сенімділік шегі әлсіз анықтамаларды сүзгілейді. Шектен төмен нәрселердің бәрі алынып тасталады, жалған санаулар азаяды. Қалған анықтамалар жинақталып, түпнұсқа фотосуретіңізде түрлі-түсті нүктелер немесе шекара жақтаулары ретінде көрсетіледі: жалпы сан және нені қайда санағанның визуалды картасы.

Жұмыс үстеліндегі металл болттар, әрқайсысында жасыл жасанды интеллект анықтау белгілері, нысанды санау қабаттамаларының қалай жұмыс істейтінін көрсетеді

Дәлдік айырмашылығы: жасанды интеллект неге көздеріңізден озып кетеді

Адам көруінің көпшілік ойламайтын қатаң шегі бар. Когнитивтік ғалымдар мұны subitizing деп атайды: ми 1-ден 4-ке дейінгі нысан мөлшерін дерлік мінсіз дәлдікпен лезде тани алады. Бұл шектен тыс бір-бірлеп санау керек және қателер ене бастайды.

Nventory зерттеуі қалыпты жұмыс жылдамдығында тауарлық-материалдық қорларды санайтын адамдардың орташа шамамен 91% дәлдікке қол жеткізетінін, яғни әрбір 10 нысаннан біреуін қате санайтынын анықтады. Бұл қате деңгейі шаршау, зейіннің бөлінуі және мөлшердің артуымен көтеріледі. Сөредегі 200 бекіткішке қарағанда миыңыз санамайды, болжайды.

Жасанды интеллект шаршамайды, орнын жоғалтпайды немесе болжамайды. Нақты қойма жағдайларында сыналған дәл баптауланған YOLOv11 моделі бірнеше сынақ кезеңінде 97% санау дәлдігіне қол жеткізді (Springer, 2026). Таза, жақсы жарықтандырылған кескіндермен бақыланатын жағдайларда дәлдік 99%-ға жетеді. Айырмашылық мөлшер өскен сайын ұлғаяды.

50 нысан шегі

50 нысанда адам мен жасанды интеллект санау дәлдігі салыстырмалы деңгейде. 500-де жасанды интеллект баяуламайды, ал сіздің қате деңгейіңіз әрбір өткен минутпен көтеріледі. Сан неғұрлым көп болса, артықшылық соғұрлым үлкен.

Жылдамдық: минуттар мен секундтар

Қолмен тауарлық-материалдық қорларды санайтын қойма жұмысшысы сағатына шамамен 250-ден 750-ге дейін нысанды өңдейді. Орташа қойманың толық физикалық санағы бір командамен 1-ден 3 күнге дейін созылады.

Жасанды интеллект санау жүйесі заманауи жабдықта бір кескінді 250 миллисекундтан аз уақытта өңдейді. Смартфонда да әдетте 1-ден 3 секундқа дейін уақыт алады. Бір фотосуретте жүздеген нысан болуы мүмкін, барлығы бір өтуде саналады.

Есеп теңсіз. Төрт адамдық команданың 8 сағаттық жұмыс күнінде атқаратын тапсырмасы, шамамен 2,500 тауар коды, әрбір сөре фотосуретке түсіріліп өңделгеннен кейін минуттар ішінде аяқталуы мүмкін. Тығыншылық санаудан фотосуретке түсіруге ауысады.

Қауіпсіздік жилеті киген қойма жұмысшысы жүздеген қораппен тиелген биік сөрелерге қарап тұр, қолмен тауарлық-материалдық қорларды санау масштабын көрсетеді

Жасанды интеллект санауы қиналатын жерлер

Жасанды интеллект санауы мінсіз емес. Осал тұстарын білу қашан сенуге және қашан нәтижені тексеруге болатынын шешуге көмектеседі.

Қабаттасқан және үйілген нысандар

Модель тек беткі қабаттағыларды көреді. Астында қалған нысандар камераға көрінбейді. ICCV 2025 зерттеуі үйілген нысандардың ең қиын санау мәселелерінің бірі болып қала беретінін растады.

Өте кішкентай нысандар

Кескінде шамамен 20 пиксельден кіші нысандар шуылдан ажыратылуы қиын болады. Жоғары ажыратымдылықтағы фотосуреттер көмектеседі, бірақ практикалық шек бар.

Тығыз, шашыраңқы сахналар

Нысандар бір-біріне тығылғанда, модель көршілес нысандарды бір анықтама ретінде біріктіруі немесе арадағы нысандарды жіберіп алуы мүмкін.

Мөлдір немесе шағылысатын нысандар

Шыны, мөлдір пластик және жылтыр беттерде айқын шеттер жоқ, бұл жіберіп алынған немесе жалған санауларға әкеледі.

Бір кадрдағы өте жоғары мөлшерлер

Бір кескінде 1,000-нан жоғары санау кішігірім нысан басына қателерді байқалатын жиынтықтарға ұлғайтады. Бірнеше фотосуретке бөлу мұны шешеді.

Қолмен санау әлі де жеңетін жағдайлар

Жасанды интеллектке фотосуреттегі көрінетін нысандар қажет. Адам пайымдауы әлі де жақсы құрал болатын жағдайлар:

  • 10-нан аз нысан - Миыңыздың subitizing қабілеті жылдам қарауды кез келген қосымшадан жылдамырақ етеді.
  • Толығымен жасырын нысандар - Жабық қораптардың ішіндегі, қабырғалардың артындағы немесе басқа нысандардың астындағы заттар камераға көрінбейді.
  • Аралас ретсіз үйінділер - Кездейсоқ бағыттағы әртүрлі нысандардың араласуы визуалды біркелкілікті күтетін модельдерді шатастыруы мүмкін.
  • Камера жоқ - Кейде ең жылдам жол жай ғана қолмен санау.

Практикалық бөлу сызығы: барлық нысандар анық көрінсе және шамамен 20-дан көп болса, жасанды интеллект дерлік әрқашан жылдамырақ, дәлірек нәтиже береді.

Қараңғы бетке шашыратылған кішкентай электрондық компоненттерді фотосуретке түсіру үшін смартфон ұстап тұрған адам, телефонмен нысандарды санаудың қаншалықты оңай екенін көрсетеді

Қорытынды

Жасанды интеллектпен санау қазір көптеген практикалық сценарийлер үшін қолмен санаудан жылдамырақ, дәлірек және тұрақтырақ. Қалған шектеулер нақты, бірақ жақсы түсінілген және әрбір жаңа модель ұрпағымен кішірейіп келеді.

Келесі рет бөлшектер сөресіне, компоненттер науасына немесе қораптар паллетіне тап болғанда, қолмен санаудың орнына фотосуретке түсіріп көріңіз. Секундтар ішінде жауап аласыз, және ол сіздікінен дәлірек болуы ықтимал.