AI मोजणी

AI फोटोमध्ये वस्तू कशा मोजतो (आणि तो तुमच्यापेक्षा चांगला का आहे)

तुमचे डोळे 50 बोल्टनंतर थकतात. AI ते सर्व काही सेकंदात मोजतो, प्रत्येकावर रंगीत ठिपके लावून सिद्ध करतो. हे प्रत्यक्षात कसे कार्य करते ते येथे आहे.

ZapCount Team • २९ डिसें, २०२५

schedule 5 मिनि

list या लेखात

तुम्ही फोटो अपलोड केल्यावर काय होते
अचूकतेतील अंतर: AI तुमच्या डोळ्यांपेक्षा चांगले का आहे
वेग: मिनिटे विरुद्ध सेकंद
जेथे AI मोजणीत अडचण येते
जेव्हा हाताने मोजणे अजूनही जिंकते
सारांश

तुमचे डोळे 50 बोल्टनंतर थकतात. AI तर नुकतेच सुरू झाले आहे.

हाताने मोजणे सोपे वाटते, जोपर्यंत ते कठीण होत नाही. साधारण 30 वस्तूंनंतर, तुमचा मेंदू मोजण्यावरून अंदाज लावण्यावर स्विच करतो. तुम्ही तुमची जागा गमावता, एक ओळ पुन्हा मोजता, आणि तरीही विचार करता की बरोबर मोजले का. AI-संचालित वस्तू मोजणी वेगळ्या पद्धतीने काम करते: ती संपूर्ण प्रतिमा एकाच वेळी प्रक्रिया करते, सापडलेल्या प्रत्येक वस्तूला चिन्हांकित करते, आणि सेकंदात एकूण संख्या देते. हे कसे कार्य करते ते येथे आहे.

तुम्ही फोटो अपलोड केल्यावर काय होते

तुम्ही AI मोजणी साधनाला फोटो पाठवता तेव्हा तीन गोष्टी वेगाने घडतात.

प्रथम, सिस्टम तुमची प्रतिमा प्रीप्रोसेस करते: मानक आकारात बदलणे, रंग सामान्य करणे, आणि गुणोत्तर समायोजित करणे. यात मिलिसेकंद लागतात.

त्यानंतर ओळख येते. एक कॉम्प्युटर व्हिजन मॉडेल एकाच फॉरवर्ड पासमध्ये संपूर्ण प्रतिमा स्कॅन करते. YOLO (You Only Look Once) सारख्या आधुनिक आर्किटेक्चर प्रतिमेला ग्रिडमध्ये विभागतात आणि प्रत्येक सेलसाठी एकाच वेळी वस्तूंचे स्थान, वर्गीकरण आणि विश्वास स्कोर अंदाज करतात. हा एक पान शब्दाशब्दाने वाचणे आणि संपूर्ण पान एका नजरेत पाहणे यातील फरक आहे.

मॉडेल सापडलेल्या प्रत्येक वस्तूसाठी एक वर्गीकरण (ती वस्तू काय आहे असे वाटते), एक स्थान (प्रतिमेतील निर्देशांक), आणि 0 ते 1 दरम्यान विश्वास स्कोर देते जे ती किती खात्री आहे हे दर्शवते. 0.85 स्कोर म्हणजे मॉडेल 85% खात्री आहे की त्या ठिकाणी एक वास्तविक वस्तू सापडली.

शेवटी, एक विश्वास उंबरठा कमकुवत ओळखींना गाळतो. उंबरठ्याखालील सर्व काही काढून टाकले जाते, ज्यामुळे चुकीची मोजणी कमी होते. उर्वरित ओळखी एकत्रित केल्या जातात आणि तुमच्या मूळ फोटोवर रंगीत ठिपके किंवा बाउंडिंग बॉक्स म्हणून प्रदर्शित केल्या जातात: एक एकूण मोजणी आणि काय मोजले गेले आणि कुठे याचा व्हिज्युअल नकाशा.

कार्यपट्टीवरील धातूचे बोल्ट ज्यावर प्रत्येकावर हिरवे AI ओळख चिन्ह आहेत, वस्तू मोजणी ओव्हरले कसे कार्य करतात हे दर्शवितो

अचूकतेतील अंतर: AI तुमच्या डोळ्यांपेक्षा चांगले का आहे

मानवी दृष्टीला एक कठोर मर्यादा आहे ज्याबद्दल बहुतेक लोक कधी विचार करत नाहीत. संज्ञानात्मक शास्त्रज्ञ याला subitizing म्हणतात: मेंदू 1 ते 4 वस्तूंची संख्या जवळजवळ परिपूर्ण अचूकतेने तात्काळ ओळखू शकतो. त्या मर्यादेनंतर, तुम्हाला एकएक करून मोजावे लागते, आणि चुका सुरू होतात.

Nventory च्या संशोधनात आढळले की सामान्य कार्य गतीने इन्व्हेंटरी मोजणारे मनुष्य सरासरी 91% अचूकता मिळवतात, म्हणजे प्रत्येक 10 वस्तूंमध्ये एक चुकीची मोजणी. ही त्रुटी दर थकवा, विचलन आणि प्रमाणासह वाढते. तुम्ही शेल्फवरील 200 फास्टनर पाहत असताना, तुमचा मेंदू अंदाज लावत असतो, मोजत नसतो.

AI थकत नाही, जागा गमावत नाही किंवा अंदाज लावत नाही. वास्तविक गोदाम परिस्थितीत चाचणी केलेल्या फाइन-ट्यून्ड YOLOv11 मॉडेलने अनेक फेऱ्यांच्या चाचणीत 97% मोजणी अचूकता मिळवली (Springer, 2026). नियंत्रित परिस्थितीत स्वच्छ, चांगल्या प्रकाशाच्या प्रतिमांसह, अचूकता 99% पर्यंत पोहोचते. प्रमाण वाढल्यावर हे अंतर आणखी वाढते.

50 वस्तूंचा उंबरठा

50 वस्तूंवर, मानवी आणि AI मोजणी अचूकता तुलनीय आहे. 500 वर, AI क्वचितच मंद होतो तर तुमचा त्रुटी दर प्रत्येक मिनिटागणिक वाढतो. जितकी मोठी मोजणी, तितका मोठा फायदा.

वेग: मिनिटे विरुद्ध सेकंद

गोदामातील कर्मचारी मॅन्युअली इन्व्हेंटरी मोजताना प्रति तास 250 ते 750 वस्तू प्रक्रिया करतो. मध्यम गोदामाची पूर्ण भौतिक मोजणी एका टीमसह 1 ते 3 दिवस लागते.

AI मोजणी प्रणाली आधुनिक हार्डवेअरवर एक प्रतिमा 250 मिलिसेकंदांपेक्षा कमी वेळात प्रक्रिया करते. स्मार्टफोनवरही, सामान्यतः 1 ते 3 सेकंद लागतात. एका फोटोमध्ये शेकडो वस्तू असू शकतात, सर्व एकाच पासमध्ये मोजल्या जातात.

गणित एकतर्फी आहे. चार लोकांच्या टीमला 8 तासांचा दिवस लागणारे काम, सुमारे 2,500 SKU, प्रत्येक शेल्फ फोटोग्राफ करून प्रक्रिया केल्यास मिनिटांत पूर्ण होते. अडथळा मोजण्यावरून फोटोग्राफ करण्यावर बदलतो.

सुरक्षा जॅकेट घातलेला गोदाम कर्मचारी शेकडो बॉक्सने भरलेल्या उंच शेल्फकडे पाहत आहे, मॅन्युअल इन्व्हेंटरी मोजणीचे प्रमाण दर्शवितो

जेथे AI मोजणीत अडचण येते

AI मोजणी अचूक नाही. तिच्या कमकुवत बाजू जाणून घेतल्यास कधी विश्वास ठेवायचा आणि कधी परिणाम तपासायचा हे ठरवण्यास मदत होते.

एकावर एक ठेवलेल्या आणि रचलेल्या वस्तू

मॉडेल फक्त पृष्ठभागावरील वस्तू पाहते. खाली दबलेल्या वस्तू कॅमेऱ्यासाठी अदृश्य असतात. ICCV 2025 संशोधनाने पुष्टी केली की रचलेल्या वस्तू मोजणीच्या सर्वात कठीण समस्यांपैकी एक आहेत.

अत्यंत लहान वस्तू

प्रतिमेत अंदाजे 20 पिक्सेलपेक्षा कमी असलेल्या वस्तू ध्वनीपासून वेगळ्या करणे कठीण होते. उच्च-रिझोल्यूशन फोटो मदत करतात, पण एक व्यावहारिक मर्यादा आहे.

दाट, गोंधळलेले दृश्य

जेव्हा वस्तू एकत्र गर्दी करतात, तेव्हा मॉडेल शेजारच्या वस्तूंना एका ओळखीत विलीन करू शकते किंवा इतरांमध्ये दबलेल्या वस्तू चुकवू शकते.

पारदर्शक किंवा परावर्तक वस्तू

काच, स्पष्ट प्लास्टिक आणि चमकदार पृष्ठभागांना स्पष्ट कडा नसतात, ज्यामुळे चुकलेल्या किंवा भ्रामक मोजण्या होतात.

एका फ्रेममध्ये खूप जास्त प्रमाण

एका प्रतिमेत 1,000 पेक्षा जास्त मोजणी प्रति-वस्तू लहान चुका लक्षणीय एकूणात बदलते. अनेक फोटोंमध्ये विभागणे हे सोडवते.

जेव्हा हाताने मोजणे अजूनही जिंकते

AI ला फोटोग्राफमध्ये दिसणाऱ्या वस्तू आवश्यक असतात. अशा परिस्थिती आहेत जेथे मानवी निर्णय अजूनही चांगले साधन आहे:

10 पेक्षा कमी वस्तू - तुमच्या मेंदूची subitizing क्षमता एक झटपट नजर कोणत्याही अ‍ॅपपेक्षा जलद बनवते.
पूर्णपणे लपलेल्या वस्तू - बंद बॉक्समध्ये, भिंतींमागे किंवा इतर वस्तूंखाली असलेल्या गोष्टी कॅमेऱ्यासाठी अदृश्य असतात.
मिश्रित अनियमित ढीग - यादृच्छिक दिशांमध्ये अत्यंत वेगवेगळ्या वस्तूंचा ढीग दृश्य सुसंगततेची अपेक्षा करणाऱ्या मॉडेल्सना गोंधळात टाकू शकतो.
कॅमेरा उपलब्ध नाही - कधीकधी सर्वात वेगवान मार्ग म्हणजे फक्त हाताने मोजणे.

व्यावहारिक विभाजन रेषा: जर सर्व वस्तू स्पष्टपणे दिसत असतील आणि 20 पेक्षा जास्त असतील, तर AI जवळजवळ नेहमीच जलद आणि अधिक अचूक परिणाम देतो.

व्यक्ती गडद पृष्ठभागावर पसरलेल्या लहान इलेक्ट्रॉनिक घटकांचा फोटो काढण्यासाठी स्मार्टफोन धरत आहे, फोनने वस्तू मोजणे किती सोपे आहे हे दर्शवितो

सारांश

AI-संचालित मोजणी आता बहुतेक व्यावहारिक परिस्थितींसाठी मॅन्युअल मोजणीपेक्षा जलद, अधिक अचूक आणि अधिक सुसंगत आहे. उर्वरित मर्यादा वास्तविक आहेत पण चांगल्या प्रकारे समजल्या गेल्या आहेत, आणि प्रत्येक नव्या मॉडेल पिढीसह कमी होत आहेत.

पुढच्या वेळी तुम्हाला पार्ट्सची शेल्फ, घटकांची ट्रे किंवा बॉक्सची पॅलेट दिसल्यावर, हाताने मोजण्याऐवजी फोटो काढून पहा. तुम्हाला सेकंदात उत्तर मिळेल, आणि ते कदाचित तुमच्या मोजणीपेक्षा अधिक अचूक असेल.

AI मोजणी कॉम्प्युटर व्हिजन वस्तू ओळख हे कसे कार्य करते

AI फोटोमध्ये वस्तू कशा मोजतो (आणि तो तुमच्यापेक्षा चांगला का आहे)

तुम्ही फोटो अपलोड केल्यावर काय होते

अचूकतेतील अंतर: AI तुमच्या डोळ्यांपेक्षा चांगले का आहे

वेग: मिनिटे विरुद्ध सेकंद

जेथे AI मोजणीत अडचण येते

जेव्हा हाताने मोजणे अजूनही जिंकते

सारांश

तुम्हाला हे देखील आवडू शकते

मॅन्युअल विरुद्ध AI मोजणी: अल्गोरिदमवर कधी विश्वास ठेवावा

ड्रोन फोटोमधून AI ने सोलर पॅनेल मोजा

AI ने लाकडाचे ओंडके मोजणे: जलद timber inventory