چشمان شما بعد از 50 پیچ خسته میشوند. هوش مصنوعی تازه گرم شده است.
شمارش دستی اشیا ساده به نظر میرسد تا زمانی که دیگر ساده نباشد. بعد از حدود 30 مورد, مغز شما از شمارش به تخمین تغییر میکند. جای خود را گم میکنید, یک ردیف را دوباره میشمارید و هنوز مطمئن نیستید که درست شمردهاید. شمارش اشیا با هوش مصنوعی رویکرد متفاوتی دارد: کل تصویر را یکجا پردازش میکند, هر مورد را علامتگذاری میکند و مجموع را در چند ثانیه برمیگرداند. در اینجا نحوه کار آن را توضیح میدهیم.
وقتی یک عکس آپلود میکنید چه اتفاقی میافتد
وقتی یک عکس را به ابزار شمارش هوش مصنوعی ارسال میکنید, سه اتفاق به سرعت پشت سر هم رخ میدهد.
ابتدا سیستم تصویر شما را پیشپردازش میکند: تغییر اندازه به ابعاد استاندارد, نرمالسازی رنگها و تنظیم نسبت تصویر. این کار در چند میلیثانیه انجام میشود.
سپس مرحله تشخیص فرا میرسد. یک مدل بینایی کامپیوتری کل تصویر را در یک گذر رو به جلو اسکن میکند. معماریهای مدرن مانند YOLO (You Only Look Once) تصویر را به یک شبکه تقسیم میکنند و مکان اشیا, طبقهبندیها و امتیازات اطمینان را برای هر سلول به طور همزمان پیشبینی میکنند. تفاوتش مانند خواندن یک صفحه کلمه به کلمه در مقابل درک کل صفحه در یک نگاه است.
برای هر شیئی که مدل پیدا میکند, یک طبقهبندی (آنچه فکر میکند شیء است), یک مکان (مختصات در تصویر) و یک امتیاز اطمینان بین 0 و 1 که نشاندهنده میزان اطمینان است, خروجی میدهد. امتیاز 0.85 به این معنی است که مدل 85% مطمئن است که یک شیء واقعی در آن نقطه پیدا کرده است.
در نهایت, یک آستانه اطمینان تشخیصهای ضعیف را فیلتر میکند. هر چیزی زیر حد آستانه حذف میشود و شمارشهای نادرست کاهش مییابد. تشخیصهای باقیمانده جمعبندی شده و به صورت نقاط رنگی یا کادرهای محصورکننده روی عکس اصلی شما نمایش داده میشوند: یک عدد کل به همراه نقشه بصری دقیق از آنچه شمرده شده و کجا.

شکاف دقت: چرا هوش مصنوعی از چشمان شما بهتر عمل میکند
بینایی انسان محدودیت سختی دارد که بیشتر مردم هرگز به آن فکر نمیکنند. دانشمندان شناختی آن را subitizing مینامند: مغز میتواند فوراً مقادیر 1 تا 4 مورد را با دقت تقریباً کامل تشخیص دهد. فراتر از این آستانه, باید یکی یکی بشمارید و خطاها شروع به نفوذ میکنند.
تحقیقات Nventory نشان داد که انسانها هنگام شمارش موجودی با سرعت عادی کار, به طور متوسط حدود 91% دقت دارند, تقریباً یک اشتباه در هر 10 مورد. این نرخ خطا با خستگی, حواسپرتی و تعداد افزایش مییابد. وقتی به 200 قطعه اتصال روی قفسه خیره شدهاید, مغز شما حدس میزند نه میشمارد.
هوش مصنوعی خسته نمیشود, جای خود را گم نمیکند و تخمین نمیزند. یک مدل تنظیمشده YOLOv11 که در شرایط واقعی انبار آزمایش شد, دقت شمارش 97% را در چندین دور آزمایش به دست آورد (Springer, 2026). در شرایط کنترلشده با تصاویر تمیز و نورپردازی خوب, دقت به 99% میرسد. هرچه تعداد بیشتر شود, شکاف بزرگتر میشود.
در 50 مورد, دقت شمارش انسان و هوش مصنوعی قابل مقایسه است. در 500, هوش مصنوعی به سختی کند میشود در حالی که نرخ خطای شما با هر دقیقهای که میگذرد بالا میرود. هرچه شمارش بزرگتر باشد, مزیت بیشتر است.
سرعت: دقیقهها در برابر ثانیهها
یک کارگر انبار که به صورت دستی موجودی میشمارد, تقریباً 250 تا 750 مورد در ساعت پردازش میکند. شمارش فیزیکی کامل یک انبار متوسط با یک تیم 1 تا 3 روز طول میکشد.
یک سیستم شمارش هوش مصنوعی یک تصویر را در کمتر از 250 میلیثانیه روی سختافزار مدرن پردازش میکند. حتی روی گوشی هوشمند, معمولاً 1 تا 3 ثانیه طول میکشد. یک عکس میتواند شامل صدها مورد باشد که همه در یک گذر شمرده میشوند.
محاسبات نامتقارن است. کاری که یک تیم چهار نفره در یک روز کاری 8 ساعته انجام میدهد, حدود 2,500 واحد نگهداری, در صورت عکاسی و پردازش هر قفسه در چند دقیقه قابل انجام است. گلوگاه از شمارش به عکاسی تغییر میکند.

هوش مصنوعی در شمارش کجا مشکل دارد
شمارش با هوش مصنوعی خطاناپذیر نیست. آگاهی از نقاط ضعف آن به شما کمک میکند تصمیم بگیرید چه زمانی به آن اعتماد کنید و چه زمانی نتیجه را بررسی کنید.
مدل فقط آنچه روی سطح است را میبیند. اقلام مدفون در زیر برای دوربین نامرئی هستند. تحقیقات ICCV 2025 تأیید کرد که اشیای انباشته شده همچنان یکی از سختترین مشکلات شمارش هستند.
اقلامی که کمتر از حدود 20 پیکسل در تصویر هستند, به سختی از نویز قابل تشخیص هستند. عکسهای با وضوح بالاتر کمک میکنند, اما محدودیت عملی وجود دارد.
وقتی اشیا به هم نزدیک میشوند, مدل ممکن است اقلام مجاور را در یک تشخیص ادغام کند یا اشیای فشرده شده بین دیگران را از دست بدهد.
شیشه, پلاستیک شفاف و سطوح براق لبههای مشخصی ندارند, که منجر به شمارشهای از دست رفته یا غیرواقعی میشود.
شمارشهای بالای 1,000 در یک تصویر, خطاهای کوچک هر شیء را به مجموعهای قابل توجه تبدیل میکنند. تقسیم به چند عکس این مشکل را حل میکند.
چه زمانی شمارش دستی هنوز برنده است
هوش مصنوعی به اشیای قابل مشاهده در عکس نیاز دارد. شرایطی وجود دارد که قضاوت انسانی هنوز ابزار بهتری است:
- کمتر از 10 مورد - توانایی شمارش فوری مغز شما, یک نگاه سریع را سریعتر از هر برنامهای میکند.
- اشیای کاملاً پنهان - اقلام داخل جعبههای بسته, پشت دیوارها یا زیر اقلام دیگر برای دوربین نامرئی هستند.
- تودههای مختلط نامنظم - مجموعهای از اشیای بسیار متفاوت در جهتهای تصادفی میتواند مدلهایی را که انتظار یکنواختی بصری دارند گیج کند.
- عدم دسترسی به دوربین - گاهی سریعترین راه صرفاً شمارش دستی است.
خط تقسیم عملی: اگر همه اشیا به وضوح قابل مشاهده باشند و تعدادشان بیش از حدود 20 باشد, هوش مصنوعی تقریباً همیشه نتیجه سریعتر و دقیقتری ارائه میدهد.

نتیجهگیری
شمارش با هوش مصنوعی اکنون سریعتر, دقیقتر و یکنواختتر از شمارش دستی برای بیشتر سناریوهای عملی است. محدودیتهای باقیمانده واقعی هستند اما به خوبی شناخته شدهاند و با هر نسل جدید مدل کوچکتر میشوند.
دفعه بعد که با قفسهای از قطعات, سینیای از اجزا یا پالتی از جعبهها مواجه شدید, به جای شمارش دستی یک عکس بگیرید. در عرض چند ثانیه جواب میگیرید و احتمالاً دقیقتر از شمارش شما خواهد بود.