तुमचे डोळे 50 बोल्टनंतर थकतात. AI तर नुकतेच सुरू झाले आहे.
हाताने मोजणे सोपे वाटते, जोपर्यंत ते कठीण होत नाही. साधारण 30 वस्तूंनंतर, तुमचा मेंदू मोजण्यावरून अंदाज लावण्यावर स्विच करतो. तुम्ही तुमची जागा गमावता, एक ओळ पुन्हा मोजता, आणि तरीही विचार करता की बरोबर मोजले का. AI-संचालित वस्तू मोजणी वेगळ्या पद्धतीने काम करते: ती संपूर्ण प्रतिमा एकाच वेळी प्रक्रिया करते, सापडलेल्या प्रत्येक वस्तूला चिन्हांकित करते, आणि सेकंदात एकूण संख्या देते. हे कसे कार्य करते ते येथे आहे.
तुम्ही फोटो अपलोड केल्यावर काय होते
तुम्ही AI मोजणी साधनाला फोटो पाठवता तेव्हा तीन गोष्टी वेगाने घडतात.
प्रथम, सिस्टम तुमची प्रतिमा प्रीप्रोसेस करते: मानक आकारात बदलणे, रंग सामान्य करणे, आणि गुणोत्तर समायोजित करणे. यात मिलिसेकंद लागतात.
त्यानंतर ओळख येते. एक कॉम्प्युटर व्हिजन मॉडेल एकाच फॉरवर्ड पासमध्ये संपूर्ण प्रतिमा स्कॅन करते. YOLO (You Only Look Once) सारख्या आधुनिक आर्किटेक्चर प्रतिमेला ग्रिडमध्ये विभागतात आणि प्रत्येक सेलसाठी एकाच वेळी वस्तूंचे स्थान, वर्गीकरण आणि विश्वास स्कोर अंदाज करतात. हा एक पान शब्दाशब्दाने वाचणे आणि संपूर्ण पान एका नजरेत पाहणे यातील फरक आहे.
मॉडेल सापडलेल्या प्रत्येक वस्तूसाठी एक वर्गीकरण (ती वस्तू काय आहे असे वाटते), एक स्थान (प्रतिमेतील निर्देशांक), आणि 0 ते 1 दरम्यान विश्वास स्कोर देते जे ती किती खात्री आहे हे दर्शवते. 0.85 स्कोर म्हणजे मॉडेल 85% खात्री आहे की त्या ठिकाणी एक वास्तविक वस्तू सापडली.
शेवटी, एक विश्वास उंबरठा कमकुवत ओळखींना गाळतो. उंबरठ्याखालील सर्व काही काढून टाकले जाते, ज्यामुळे चुकीची मोजणी कमी होते. उर्वरित ओळखी एकत्रित केल्या जातात आणि तुमच्या मूळ फोटोवर रंगीत ठिपके किंवा बाउंडिंग बॉक्स म्हणून प्रदर्शित केल्या जातात: एक एकूण मोजणी आणि काय मोजले गेले आणि कुठे याचा व्हिज्युअल नकाशा.

अचूकतेतील अंतर: AI तुमच्या डोळ्यांपेक्षा चांगले का आहे
मानवी दृष्टीला एक कठोर मर्यादा आहे ज्याबद्दल बहुतेक लोक कधी विचार करत नाहीत. संज्ञानात्मक शास्त्रज्ञ याला subitizing म्हणतात: मेंदू 1 ते 4 वस्तूंची संख्या जवळजवळ परिपूर्ण अचूकतेने तात्काळ ओळखू शकतो. त्या मर्यादेनंतर, तुम्हाला एकएक करून मोजावे लागते, आणि चुका सुरू होतात.
Nventory च्या संशोधनात आढळले की सामान्य कार्य गतीने इन्व्हेंटरी मोजणारे मनुष्य सरासरी 91% अचूकता मिळवतात, म्हणजे प्रत्येक 10 वस्तूंमध्ये एक चुकीची मोजणी. ही त्रुटी दर थकवा, विचलन आणि प्रमाणासह वाढते. तुम्ही शेल्फवरील 200 फास्टनर पाहत असताना, तुमचा मेंदू अंदाज लावत असतो, मोजत नसतो.
AI थकत नाही, जागा गमावत नाही किंवा अंदाज लावत नाही. वास्तविक गोदाम परिस्थितीत चाचणी केलेल्या फाइन-ट्यून्ड YOLOv11 मॉडेलने अनेक फेऱ्यांच्या चाचणीत 97% मोजणी अचूकता मिळवली (Springer, 2026). नियंत्रित परिस्थितीत स्वच्छ, चांगल्या प्रकाशाच्या प्रतिमांसह, अचूकता 99% पर्यंत पोहोचते. प्रमाण वाढल्यावर हे अंतर आणखी वाढते.
50 वस्तूंवर, मानवी आणि AI मोजणी अचूकता तुलनीय आहे. 500 वर, AI क्वचितच मंद होतो तर तुमचा त्रुटी दर प्रत्येक मिनिटागणिक वाढतो. जितकी मोठी मोजणी, तितका मोठा फायदा.
वेग: मिनिटे विरुद्ध सेकंद
गोदामातील कर्मचारी मॅन्युअली इन्व्हेंटरी मोजताना प्रति तास 250 ते 750 वस्तू प्रक्रिया करतो. मध्यम गोदामाची पूर्ण भौतिक मोजणी एका टीमसह 1 ते 3 दिवस लागते.
AI मोजणी प्रणाली आधुनिक हार्डवेअरवर एक प्रतिमा 250 मिलिसेकंदांपेक्षा कमी वेळात प्रक्रिया करते. स्मार्टफोनवरही, सामान्यतः 1 ते 3 सेकंद लागतात. एका फोटोमध्ये शेकडो वस्तू असू शकतात, सर्व एकाच पासमध्ये मोजल्या जातात.
गणित एकतर्फी आहे. चार लोकांच्या टीमला 8 तासांचा दिवस लागणारे काम, सुमारे 2,500 SKU, प्रत्येक शेल्फ फोटोग्राफ करून प्रक्रिया केल्यास मिनिटांत पूर्ण होते. अडथळा मोजण्यावरून फोटोग्राफ करण्यावर बदलतो.

जेथे AI मोजणीत अडचण येते
AI मोजणी अचूक नाही. तिच्या कमकुवत बाजू जाणून घेतल्यास कधी विश्वास ठेवायचा आणि कधी परिणाम तपासायचा हे ठरवण्यास मदत होते.
मॉडेल फक्त पृष्ठभागावरील वस्तू पाहते. खाली दबलेल्या वस्तू कॅमेऱ्यासाठी अदृश्य असतात. ICCV 2025 संशोधनाने पुष्टी केली की रचलेल्या वस्तू मोजणीच्या सर्वात कठीण समस्यांपैकी एक आहेत.
प्रतिमेत अंदाजे 20 पिक्सेलपेक्षा कमी असलेल्या वस्तू ध्वनीपासून वेगळ्या करणे कठीण होते. उच्च-रिझोल्यूशन फोटो मदत करतात, पण एक व्यावहारिक मर्यादा आहे.
जेव्हा वस्तू एकत्र गर्दी करतात, तेव्हा मॉडेल शेजारच्या वस्तूंना एका ओळखीत विलीन करू शकते किंवा इतरांमध्ये दबलेल्या वस्तू चुकवू शकते.
काच, स्पष्ट प्लास्टिक आणि चमकदार पृष्ठभागांना स्पष्ट कडा नसतात, ज्यामुळे चुकलेल्या किंवा भ्रामक मोजण्या होतात.
एका प्रतिमेत 1,000 पेक्षा जास्त मोजणी प्रति-वस्तू लहान चुका लक्षणीय एकूणात बदलते. अनेक फोटोंमध्ये विभागणे हे सोडवते.
जेव्हा हाताने मोजणे अजूनही जिंकते
AI ला फोटोग्राफमध्ये दिसणाऱ्या वस्तू आवश्यक असतात. अशा परिस्थिती आहेत जेथे मानवी निर्णय अजूनही चांगले साधन आहे:
- 10 पेक्षा कमी वस्तू - तुमच्या मेंदूची subitizing क्षमता एक झटपट नजर कोणत्याही अॅपपेक्षा जलद बनवते.
- पूर्णपणे लपलेल्या वस्तू - बंद बॉक्समध्ये, भिंतींमागे किंवा इतर वस्तूंखाली असलेल्या गोष्टी कॅमेऱ्यासाठी अदृश्य असतात.
- मिश्रित अनियमित ढीग - यादृच्छिक दिशांमध्ये अत्यंत वेगवेगळ्या वस्तूंचा ढीग दृश्य सुसंगततेची अपेक्षा करणाऱ्या मॉडेल्सना गोंधळात टाकू शकतो.
- कॅमेरा उपलब्ध नाही - कधीकधी सर्वात वेगवान मार्ग म्हणजे फक्त हाताने मोजणे.
व्यावहारिक विभाजन रेषा: जर सर्व वस्तू स्पष्टपणे दिसत असतील आणि 20 पेक्षा जास्त असतील, तर AI जवळजवळ नेहमीच जलद आणि अधिक अचूक परिणाम देतो.

सारांश
AI-संचालित मोजणी आता बहुतेक व्यावहारिक परिस्थितींसाठी मॅन्युअल मोजणीपेक्षा जलद, अधिक अचूक आणि अधिक सुसंगत आहे. उर्वरित मर्यादा वास्तविक आहेत पण चांगल्या प्रकारे समजल्या गेल्या आहेत, आणि प्रत्येक नव्या मॉडेल पिढीसह कमी होत आहेत.
पुढच्या वेळी तुम्हाला पार्ट्सची शेल्फ, घटकांची ट्रे किंवा बॉक्सची पॅलेट दिसल्यावर, हाताने मोजण्याऐवजी फोटो काढून पहा. तुम्हाला सेकंदात उत्तर मिळेल, आणि ते कदाचित तुमच्या मोजणीपेक्षा अधिक अचूक असेल.