بازگشت به همه مقالات

هوش مصنوعی چگونه اشیا را در عکس‌ها می‌شمارد (و چرا از شما بهتر عمل می‌کند)

چشمان شما بعد از 50 پیچ خسته می‌شوند. هوش مصنوعی همه آنها را در چند ثانیه می‌شمارد, با نقاط رنگی روی هر کدام برای اثبات. در اینجا نحوه عملکرد آن را توضیح می‌دهیم.

list در این مقاله

چشمان شما بعد از 50 پیچ خسته می‌شوند. هوش مصنوعی تازه گرم شده است.

شمارش دستی اشیا ساده به نظر می‌رسد تا زمانی که دیگر ساده نباشد. بعد از حدود 30 مورد, مغز شما از شمارش به تخمین تغییر می‌کند. جای خود را گم می‌کنید, یک ردیف را دوباره می‌شمارید و هنوز مطمئن نیستید که درست شمرده‌اید. شمارش اشیا با هوش مصنوعی رویکرد متفاوتی دارد: کل تصویر را یکجا پردازش می‌کند, هر مورد را علامت‌گذاری می‌کند و مجموع را در چند ثانیه برمی‌گرداند. در اینجا نحوه کار آن را توضیح می‌دهیم.

وقتی یک عکس آپلود می‌کنید چه اتفاقی می‌افتد

وقتی یک عکس را به ابزار شمارش هوش مصنوعی ارسال می‌کنید, سه اتفاق به سرعت پشت سر هم رخ می‌دهد.

ابتدا سیستم تصویر شما را پیش‌پردازش می‌کند: تغییر اندازه به ابعاد استاندارد, نرمال‌سازی رنگ‌ها و تنظیم نسبت تصویر. این کار در چند میلی‌ثانیه انجام می‌شود.

سپس مرحله تشخیص فرا می‌رسد. یک مدل بینایی کامپیوتری کل تصویر را در یک گذر رو به جلو اسکن می‌کند. معماری‌های مدرن مانند YOLO (You Only Look Once) تصویر را به یک شبکه تقسیم می‌کنند و مکان اشیا, طبقه‌بندی‌ها و امتیازات اطمینان را برای هر سلول به طور همزمان پیش‌بینی می‌کنند. تفاوتش مانند خواندن یک صفحه کلمه به کلمه در مقابل درک کل صفحه در یک نگاه است.

برای هر شیئی که مدل پیدا می‌کند, یک طبقه‌بندی (آنچه فکر می‌کند شیء است), یک مکان (مختصات در تصویر) و یک امتیاز اطمینان بین 0 و 1 که نشان‌دهنده میزان اطمینان است, خروجی می‌دهد. امتیاز 0.85 به این معنی است که مدل 85% مطمئن است که یک شیء واقعی در آن نقطه پیدا کرده است.

در نهایت, یک آستانه اطمینان تشخیص‌های ضعیف را فیلتر می‌کند. هر چیزی زیر حد آستانه حذف می‌شود و شمارش‌های نادرست کاهش می‌یابد. تشخیص‌های باقیمانده جمع‌بندی شده و به صورت نقاط رنگی یا کادرهای محصورکننده روی عکس اصلی شما نمایش داده می‌شوند: یک عدد کل به همراه نقشه بصری دقیق از آنچه شمرده شده و کجا.

پیچ‌های فلزی روی میز کار با نشانگرهای سبز تشخیص هوش مصنوعی روی هر کدام که نحوه کار پوشش‌های شمارش اشیا را نشان می‌دهد

شکاف دقت: چرا هوش مصنوعی از چشمان شما بهتر عمل می‌کند

بینایی انسان محدودیت سختی دارد که بیشتر مردم هرگز به آن فکر نمی‌کنند. دانشمندان شناختی آن را subitizing می‌نامند: مغز می‌تواند فوراً مقادیر 1 تا 4 مورد را با دقت تقریباً کامل تشخیص دهد. فراتر از این آستانه, باید یکی یکی بشمارید و خطاها شروع به نفوذ می‌کنند.

تحقیقات Nventory نشان داد که انسان‌ها هنگام شمارش موجودی با سرعت عادی کار, به طور متوسط حدود 91% دقت دارند, تقریباً یک اشتباه در هر 10 مورد. این نرخ خطا با خستگی, حواس‌پرتی و تعداد افزایش می‌یابد. وقتی به 200 قطعه اتصال روی قفسه خیره شده‌اید, مغز شما حدس می‌زند نه می‌شمارد.

هوش مصنوعی خسته نمی‌شود, جای خود را گم نمی‌کند و تخمین نمی‌زند. یک مدل تنظیم‌شده YOLOv11 که در شرایط واقعی انبار آزمایش شد, دقت شمارش 97% را در چندین دور آزمایش به دست آورد (Springer, 2026). در شرایط کنترل‌شده با تصاویر تمیز و نورپردازی خوب, دقت به 99% می‌رسد. هرچه تعداد بیشتر شود, شکاف بزرگ‌تر می‌شود.

آستانه 50 مورد

در 50 مورد, دقت شمارش انسان و هوش مصنوعی قابل مقایسه است. در 500, هوش مصنوعی به سختی کند می‌شود در حالی که نرخ خطای شما با هر دقیقه‌ای که می‌گذرد بالا می‌رود. هرچه شمارش بزرگ‌تر باشد, مزیت بیشتر است.

سرعت: دقیقه‌ها در برابر ثانیه‌ها

یک کارگر انبار که به صورت دستی موجودی می‌شمارد, تقریباً 250 تا 750 مورد در ساعت پردازش می‌کند. شمارش فیزیکی کامل یک انبار متوسط با یک تیم 1 تا 3 روز طول می‌کشد.

یک سیستم شمارش هوش مصنوعی یک تصویر را در کمتر از 250 میلی‌ثانیه روی سخت‌افزار مدرن پردازش می‌کند. حتی روی گوشی هوشمند, معمولاً 1 تا 3 ثانیه طول می‌کشد. یک عکس می‌تواند شامل صدها مورد باشد که همه در یک گذر شمرده می‌شوند.

محاسبات نامتقارن است. کاری که یک تیم چهار نفره در یک روز کاری 8 ساعته انجام می‌دهد, حدود 2,500 واحد نگهداری, در صورت عکاسی و پردازش هر قفسه در چند دقیقه قابل انجام است. گلوگاه از شمارش به عکاسی تغییر می‌کند.

کارگر انبار با جلیقه ایمنی که به قفسه‌های بلند پر از صدها جعبه نگاه می‌کند و مقیاس شمارش دستی موجودی را نشان می‌دهد

هوش مصنوعی در شمارش کجا مشکل دارد

شمارش با هوش مصنوعی خطاناپذیر نیست. آگاهی از نقاط ضعف آن به شما کمک می‌کند تصمیم بگیرید چه زمانی به آن اعتماد کنید و چه زمانی نتیجه را بررسی کنید.

اشیای روی هم و انباشته شده

مدل فقط آنچه روی سطح است را می‌بیند. اقلام مدفون در زیر برای دوربین نامرئی هستند. تحقیقات ICCV 2025 تأیید کرد که اشیای انباشته شده همچنان یکی از سخت‌ترین مشکلات شمارش هستند.

اشیای بسیار کوچک

اقلامی که کمتر از حدود 20 پیکسل در تصویر هستند, به سختی از نویز قابل تشخیص هستند. عکس‌های با وضوح بالاتر کمک می‌کنند, اما محدودیت عملی وجود دارد.

صحنه‌های متراکم و شلوغ

وقتی اشیا به هم نزدیک می‌شوند, مدل ممکن است اقلام مجاور را در یک تشخیص ادغام کند یا اشیای فشرده شده بین دیگران را از دست بدهد.

اقلام شفاف یا بازتابنده

شیشه, پلاستیک شفاف و سطوح براق لبه‌های مشخصی ندارند, که منجر به شمارش‌های از دست رفته یا غیرواقعی می‌شود.

تعداد بسیار زیاد در یک قاب

شمارش‌های بالای 1,000 در یک تصویر, خطاهای کوچک هر شیء را به مجموع‌های قابل توجه تبدیل می‌کنند. تقسیم به چند عکس این مشکل را حل می‌کند.

چه زمانی شمارش دستی هنوز برنده است

هوش مصنوعی به اشیای قابل مشاهده در عکس نیاز دارد. شرایطی وجود دارد که قضاوت انسانی هنوز ابزار بهتری است:

  • کمتر از 10 مورد - توانایی شمارش فوری مغز شما, یک نگاه سریع را سریع‌تر از هر برنامه‌ای می‌کند.
  • اشیای کاملاً پنهان - اقلام داخل جعبه‌های بسته, پشت دیوارها یا زیر اقلام دیگر برای دوربین نامرئی هستند.
  • توده‌های مختلط نامنظم - مجموعه‌ای از اشیای بسیار متفاوت در جهت‌های تصادفی می‌تواند مدل‌هایی را که انتظار یکنواختی بصری دارند گیج کند.
  • عدم دسترسی به دوربین - گاهی سریع‌ترین راه صرفاً شمارش دستی است.

خط تقسیم عملی: اگر همه اشیا به وضوح قابل مشاهده باشند و تعدادشان بیش از حدود 20 باشد, هوش مصنوعی تقریباً همیشه نتیجه سریع‌تر و دقیق‌تری ارائه می‌دهد.

شخصی که گوشی هوشمند را نگه داشته تا از قطعات الکترونیکی کوچک پخش شده روی سطح تیره عکس بگیرد و نشان می‌دهد شمارش اشیا با گوشی چقدر آسان است

نتیجه‌گیری

شمارش با هوش مصنوعی اکنون سریع‌تر, دقیق‌تر و یکنواخت‌تر از شمارش دستی برای بیشتر سناریوهای عملی است. محدودیت‌های باقیمانده واقعی هستند اما به خوبی شناخته شده‌اند و با هر نسل جدید مدل کوچک‌تر می‌شوند.

دفعه بعد که با قفسه‌ای از قطعات, سینی‌ای از اجزا یا پالتی از جعبه‌ها مواجه شدید, به جای شمارش دستی یک عکس بگیرید. در عرض چند ثانیه جواب می‌گیرید و احتمالاً دقیق‌تر از شمارش شما خواهد بود.