அனைத்து கட்டுரைகளுக்கும் திரும்பு

AI புகைப்படங்களில் பொருள்களை எப்படி எண்ணுகிறது (அதில் ஏன் உங்களை விட சிறப்பாக செய்கிறது)

50 போல்ட்களுக்குப் பிறகு உங்கள் கண்கள் சோர்வடைகின்றன. AI அவை அனைத்தையும் நொடிகளில் எண்ணுகிறது, ஒவ்வொன்றிலும் வண்ணப் புள்ளிகளால் நிரூபிக்கிறது. இது உண்மையில் எப்படி வேலை செய்கிறது என்பது இங்கே.

list இந்தக் கட்டுரையில்

50 போல்ட்களுக்குப் பிறகு உங்கள் கண்கள் சோர்வடைகின்றன. AI இப்போதுதான் ஆரம்பிக்கிறது.

கையால் எண்ணுவது எளிதாகத் தெரிகிறது, அது கடினமாகும் வரை. சுமார் 30 பொருட்களுக்குப் பிறகு, உங்கள் மூளை எண்ணுவதிலிருந்து மதிப்பீடு செய்வதற்கு மாறுகிறது. நீங்கள் இடத்தை இழக்கிறீர்கள், ஒரு வரிசையை மீண்டும் எண்ணுகிறீர்கள், இன்னும் சரியாக எண்ணினீர்களா என்று யோசிக்கிறீர்கள். AI-இயக்கப்படும் பொருள் எண்ணிக்கை வேறு அணுகுமுறையை எடுக்கிறது: இது ஒரு முழு படத்தையும் ஒரே நேரத்தில் செயலாக்குகிறது, கண்டறியும் ஒவ்வொரு பொருளையும் குறிக்கிறது, மொத்தத்தை நொடிகளில் தருகிறது. இது எப்படி வேலை செய்கிறது என்பது இங்கே.

நீங்கள் புகைப்படத்தை பதிவேற்றும்போது என்ன நடக்கிறது

நீங்கள் AI எண்ணிக்கை கருவிக்கு ஒரு புகைப்படத்தை அனுப்பும்போது, மூன்று விஷயங்கள் விரைவான வரிசையில் நிகழ்கின்றன.

முதலில், கணினி உங்கள் படத்தை முன்செயலாக்கம் செய்கிறது: ஒரு நிலையான அளவுக்கு மறுஅளவிடுதல், வண்ணங்களை இயல்பாக்குதல், விகிதத்தை சரிசெய்தல். இது மில்லி நொடிகள் எடுக்கும்.

அடுத்து கண்டறிதல் வருகிறது. ஒரு கணினிப் பார்வை மாதிரி ஒரே ஒரு ஃபார்வர்ட் பாஸில் முழு படத்தையும் ஸ்கேன் செய்கிறது. YOLO (You Only Look Once) போன்ற நவீன கட்டமைப்புகள் படத்தை ஒரு கட்டத்தில் பிரித்து, ஒவ்வொரு கலத்திற்கும் பொருள் இருப்பிடங்கள், வகைப்பாடுகள், நம்பிக்கை மதிப்பெண்கள் ஆகியவற்றை ஒரே நேரத்தில் கணிக்கின்றன. ஒரு பக்கத்தை வார்த்தை வார்த்தையாக படிப்பதற்கும், முழு பக்கத்தையும் ஒரே பார்வையில் உள்வாங்குவதற்கும் உள்ள வேறுபாடாக இதை நினைத்துப் பாருங்கள்.

மாதிரி கண்டறியும் ஒவ்வொரு பொருளுக்கும், ஒரு வகைப்பாடு (பொருள் என்ன என்று அது நினைக்கிறது), ஒரு இருப்பிடம் (படத்தில் ஆயத்தொலைவுகள்), மற்றும் 0 முதல் 1 வரை ஒரு நம்பிக்கை மதிப்பெண் ஆகியவற்றை வெளியிடுகிறது. 0.85 மதிப்பெண் என்றால் மாதிரி அந்த இடத்தில் ஒரு உண்மையான பொருளைக் கண்டறிந்ததாக 85% நம்பிக்கையாக உள்ளது.

இறுதியாக, ஒரு நம்பிக்கை வரம்பு பலவீனமான கண்டறிதல்களை வடிகட்டுகிறது. கட்டுப்பாட்டுக்கு கீழே உள்ளவை நிராகரிக்கப்படுகின்றன, இது தவறான எண்ணிக்கைகளைக் குறைக்கிறது. மீதமுள்ள கண்டறிதல்கள் கூட்டப்பட்டு உங்கள் அசல் புகைப்படத்தில் வண்ணப் புள்ளிகள் அல்லது எல்லைப் பெட்டிகளாகக் காட்டப்படுகின்றன: ஒரு மொத்த எண்ணிக்கை மற்றும் என்ன எங்கே எண்ணப்பட்டது என்பதன் காட்சி வரைபடம்.

Metal bolts on a workbench with green AI detection markers on each one, showing how object counting overlays work

துல்லியத்தின் இடைவெளி: AI ஏன் உங்கள் கண்களை விட சிறப்பாக செயல்படுகிறது

மனிதப் பார்வைக்கு ஒரு கடினமான வரம்பு உள்ளது, அதைப் பற்றி பெரும்பாலான மக்கள் நினைப்பதில்லை. அறிவாற்றல் விஞ்ஞானிகள் இதை subitizing என்று அழைக்கிறார்கள்: மூளை 1 முதல் 4 பொருட்களின் அளவை கிட்டத்தட்ட சரியான துல்லியத்துடன் உடனடியாக அடையாளம் காண முடியும். அந்த வரம்பைத் தாண்டி, நீங்கள் ஒவ்வொன்றாக எண்ண வேண்டும், பிழைகள் ஊடுருவத் தொடங்குகின்றன.

Nventory-ன் ஆராய்ச்சி, சாதாரண வேலை வேகத்தில் சரக்குகளை எண்ணும் மனிதர்கள் சராசரியாக சுமார் 91% துல்லியத்தை அடைகிறார்கள் என்றும், ஒவ்வொரு 10 பொருட்களுக்கும் தோராயமாக ஒரு தவறான எண்ணிக்கை என்றும் கண்டறிந்தது. அந்த பிழை விகிதம் சோர்வு, கவனச்சிதறல் மற்றும் அளவுடன் அதிகரிக்கிறது. ஒரு அலமாரியில் 200 ஃபாஸ்ட்னர்களைப் பார்க்கும்போது, உங்கள் மூளை யூகிக்கிறது, எண்ணவில்லை.

AI சோர்வடைவதில்லை, இடத்தை இழப்பதில்லை, மதிப்பீடு செய்வதில்லை. உண்மையான கிடங்கு நிலைமைகளில் சோதிக்கப்பட்ட ஒரு ஃபைன்-ட்யூன் செய்யப்பட்ட YOLOv11 மாதிரி பல சுற்று சோதனைகளில் 97% எண்ணிக்கை துல்லியத்தை அடைந்தது (Springer, 2026). சுத்தமான, நல்ல ஒளியுள்ள படங்களுடன் கட்டுப்படுத்தப்பட்ட நிலைமைகளில், துல்லியம் 99% அடைகிறது. அளவு அதிகரிக்க, இடைவெளி மேலும் விரிவடைகிறது.

50 பொருட்களின் வரம்பு

50 பொருட்களில், மனித மற்றும் AI எண்ணிக்கை துல்லியம் ஒப்பிடத்தக்கது. 500-ல், AI அரிதாகவே மெதுவாகிறது, அதே நேரத்தில் உங்கள் பிழை விகிதம் ஒவ்வொரு கடந்துசெல்லும் நிமிடத்திலும் அதிகரிக்கிறது. எண்ணிக்கை எவ்வளவு பெரியதோ, நன்மையும் அவ்வளவு பெரியது.

வேகம்: நிமிடங்கள் எதிர் நொடிகள்

ஒரு கிடங்கு பணியாளர் கைமுறையாக சரக்குகளை எண்ணும்போது மணிநேரத்திற்கு சுமார் 250 முதல் 750 பொருட்களை செயலாக்குகிறார். ஒரு நடுத்தர கிடங்கின் முழு உடல்நிலை எண்ணிக்கை ஒரு குழுவுடன் 1 முதல் 3 நாட்கள் ஆகும்.

ஒரு AI எண்ணிக்கை அமைப்பு நவீன வன்பொருளில் 250 மில்லி நொடிகளுக்குள் ஒரு படத்தை செயலாக்குகிறது. ஸ்மார்ட்போனிலும் கூட, இது வழக்கமாக 1 முதல் 3 நொடிகள் எடுக்கும். ஒரு புகைப்படத்தில் நூற்றுக்கணக்கான பொருட்கள் இருக்கலாம், அனைத்தும் ஒரே பாஸில் எண்ணப்படுகின்றன.

கணக்கு ஒருபக்கமானது. நான்கு பேர் கொண்ட குழுவிற்கு 8 மணிநேர நாள் தேவைப்படும் ஒரு பணி, தோராயமாக 2,500 SKU, ஒவ்வொரு அலமாரியையும் புகைப்படம் எடுத்து செயலாக்கினால் நிமிடங்களில் முடிக்கலாம். தடையானது எண்ணுவதிலிருந்து புகைப்படம் எடுப்பதற்கு மாறுகிறது.

Warehouse worker in safety vest looking up at tall shelves stacked with hundreds of boxes, showing the scale of manual inventory counting

AI எண்ணிக்கை எங்கே சிரமப்படுகிறது

AI எண்ணிக்கை தவறற்றது அல்ல. அதன் பலவீனமான புள்ளிகளை அறிந்தால், எப்போது நம்ப வேண்டும், எப்போது முடிவை சரிபார்க்க வேண்டும் என்று முடிவு செய்ய உதவும்.

மேற்பொருந்தும் மற்றும் அடுக்கப்பட்ட பொருட்கள்

மாதிரி மேற்பரப்பில் உள்ளதை மட்டுமே பார்க்கிறது. அடியில் புதைந்த பொருட்கள் கேமராவிற்கு தெரியாது. ICCV 2025 ஆராய்ச்சி, அடுக்கப்பட்ட பொருட்கள் மிகக் கடினமான எண்ணிக்கைப் பிரச்சனைகளில் ஒன்றாக இருப்பதை உறுதிப்படுத்தியது.

மிகச் சிறிய பொருட்கள்

படத்தில் தோராயமாக 20 பிக்சல்களுக்குக் குறைவான பொருட்களை இரைச்சலிலிருந்து வேறுபடுத்துவது கடினமாகிறது. அதிக தெளிவுத்திறன் புகைப்படங்கள் உதவுகின்றன, ஆனால் ஒரு நடைமுறை வரம்பு உள்ளது.

அடர்த்தியான, ஒழுங்கற்ற காட்சிகள்

பொருட்கள் ஒன்றாக நெருங்கும்போது, மாதிரி அருகிலுள்ள பொருட்களை ஒரே கண்டறிதலாக இணைக்கலாம் அல்லது மற்றவற்றுக்கு இடையே நெருக்கப்பட்ட பொருட்களை தவறவிடலாம்.

ஒளிபுகும் அல்லது பிரதிபலிக்கும் பொருட்கள்

கண்ணாடி, தெளிவான பிளாஸ்டிக் மற்றும் பளபளப்பான மேற்பரப்புகளில் தெளிவான விளிம்புகள் இல்லை, இது தவறவிடப்பட்ட அல்லது பேய் எண்ணிக்கைகளுக்கு வழிவகுக்கிறது.

ஒரு பிரேமில் மிக அதிக அளவு

ஒரு படத்தில் 1,000-க்கு மேல் எண்ணிக்கை ஒவ்வொரு பொருளுக்கான சிறிய பிழைகளை கவனிக்கத்தக்க மொத்தங்களாக பெரிதாக்குகிறது. பல புகைப்படங்களாக பிரிப்பது இதை தீர்க்கிறது.

கையால் எண்ணுவது எப்போது இன்னும் வெற்றி பெறுகிறது

AI-க்கு புகைப்படத்தில் தெரியும் பொருட்கள் தேவை. மனித தீர்ப்பு இன்னும் சிறந்த கருவியாக இருக்கும் சூழ்நிலைகள் உள்ளன:

  • 10-க்கும் குறைவான பொருட்கள் - உங்கள் மூளையின் subitizing திறன் ஒரு விரைவான பார்வையை எந்த ஆப்பையும் விட வேகமாக்குகிறது.
  • முழுமையாக மறைக்கப்பட்ட பொருட்கள் - மூடிய பெட்டிகளுக்குள், சுவர்களுக்குப் பின்னால், அல்லது மற்ற பொருட்களுக்கு அடியில் உள்ள பொருள்கள் கேமராவிற்கு தெரியாது.
  • கலப்பு ஒழுங்கற்ற குவியல்கள் - சீரற்ற திசைகளில் மிகவும் வேறுபட்ட பொருட்களின் குவியல் காட்சி நிலைத்தன்மையை எதிர்பார்க்கும் மாதிரிகளை குழப்பலாம்.
  • கேமரா கிடைக்கவில்லை - சில நேரங்களில் வேகமான வழி வெறுமனே கையால் எண்ணுவதுதான்.

நடைமுறை பிரிவு கோடு: அனைத்து பொருட்களும் தெளிவாகத் தெரிந்தால், சுமார் 20-க்கும் அதிகமாக இருந்தால், AI கிட்டத்தட்ட எப்போதும் வேகமான, துல்லியமான முடிவை தருகிறது.

Person holding a smartphone to photograph small electronic components spread on a dark surface, showing how easy it is to count objects with a phone

முடிவுரை

AI-இயக்கப்படும் எண்ணிக்கை இப்போது பெரும்பாலான நடைமுறை சூழ்நிலைகளுக்கு கைமுறை எண்ணிக்கையை விட வேகமானது, துல்லியமானது மற்றும் நிலையானது. மீதமுள்ள வரம்புகள் உண்மையானவை ஆனால் நன்கு புரிந்துகொள்ளப்பட்டவை, ஒவ்வொரு புதிய மாதிரி தலைமுறையிலும் சுருங்கி வருகின்றன.

அடுத்த முறை நீங்கள் பாகங்களின் அலமாரி, கூறுகளின் தட்டு, அல்லது பெட்டிகளின் தட்டின் முன் நிற்கும்போது, கையால் எண்ணுவதற்குப் பதிலாக ஒரு புகைப்படம் எடுத்துப் பாருங்கள். நொடிகளில் பதில் கிடைக்கும், அது உங்கள் எண்ணிக்கையை விட துல்லியமாக இருக்கும்.