Bagaimana AI mengira objek dalam foto (dan mengapa ia lebih hebat daripada anda)

Mata anda penat selepas mengira 50 bolt. AI baru sahaja bermula.

Mengira barang secara manual terasa mudah sehingga ia tidak lagi mudah. Melepasi sekitar 30 item, otak anda beralih daripada mengira kepada menganggar. Anda kehilangan tempat, mengira semula satu baris, dan masih tertanya-tanya sama ada hasilnya betul. Pengiraan objek berkuasa AI mengambil pendekatan berbeza: ia memproses keseluruhan imej sekaligus, menanda setiap item yang dijumpai, dan mengembalikan jumlah dalam beberapa saat. Begini cara ia berfungsi.

Apa yang berlaku apabila anda memuat naik foto

Apabila anda menghantar foto kepada alat pengiraan AI, tiga perkara berlaku secara berturutan dengan pantas.

Pertama, sistem memproses imej anda terlebih dahulu: mengubah saiz kepada dimensi standard, menormalisasi warna, dan menyesuaikan nisbah aspek. Ini mengambil masa milisaat sahaja.

Seterusnya ialah pengesanan. Model penglihatan komputer mengimbas keseluruhan imej dalam satu forward pass. Seni bina moden seperti YOLO (You Only Look Once) membahagikan imej kepada grid dan meramal lokasi objek, klasifikasi, dan skor keyakinan untuk setiap sel secara serentak. Bayangkan ia seperti perbezaan antara membaca halaman perkataan demi perkataan dan menangkap keseluruhan halaman dalam satu pandangan.

Untuk setiap objek yang dijumpai model, ia menghasilkan klasifikasi (apa yang disangka sebagai objek tersebut), lokasi (koordinat dalam imej), dan skor keyakinan antara 0 dan 1 yang mewakili tahap kepastiannya. Skor 0.85 bermakna model 85% yakin ia menjumpai objek sebenar di titik tersebut.

Akhir sekali, ambang keyakinan menapis pengesanan yang lemah. Apa-apa di bawah had tersebut dibuang, mengurangkan kiraan palsu. Pengesanan yang tinggal dijumlahkan dan dipaparkan sebagai titik berwarna atau kotak sempadan pada foto asal anda, jumlah keseluruhan ditambah peta visual yang menunjukkan apa yang dikira dan di mana letaknya.

Metal bolts on a workbench with green AI detection markers on each one, showing how object counting overlays work

Jurang ketepatan: mengapa AI mengatasi mata anda

Penglihatan manusia mempunyai had keras yang jarang difikirkan orang. Saintis kognitif memanggilnya subitizing, otak boleh mengenali kuantiti 1 hingga 4 item secara serta-merta dengan ketepatan hampir sempurna. Melebihi ambang tersebut, anda perlu mengira satu per satu, dan kesilapan mula menyelinap masuk.

Penyelidikan daripada Nventory mendapati bahawa manusia yang mengira inventori pada kelajuan kerja biasa mempunyai ketepatan purata sekitar 91%, lebih kurang satu kesilapan kiraan untuk setiap 10 item. Kadar kesilapan itu meningkat dengan keletihan, gangguan, dan kuantiti. Pada masa anda merenung 200 pengikat di rak, otak anda sedang meneka, bukan mengira.

AI tidak keletihan, kehilangan tempat, atau menganggar. Model YOLOv11 yang telah ditala halus dan diuji dalam keadaan gudang sebenar mencapai ketepatan pengiraan 97% merentasi beberapa pusingan ujian (Springer, 2026). Dalam keadaan terkawal dengan imej yang bersih dan pencahayaan baik, ketepatan mencapai 99%. Jurang hanya semakin melebar apabila kuantiti bertambah.

Ambang 50 item

Pada 50 item, ketepatan pengiraan manusia dan AI adalah setanding. Pada 500, AI hampir tidak perlahan manakala kadar kesilapan anda meningkat setiap minit. Semakin besar kiraan, semakin besar kelebihannya.

Kelajuan: minit lawan saat

Pekerja gudang yang mengira inventori secara manual memproses kira-kira 250 hingga 750 item sejam. Pengiraan fizikal penuh gudang sederhana mengambil masa 1 hingga 3 hari dengan satu pasukan.

Sistem pengiraan AI memproses satu imej dalam masa kurang daripada 250 milisaat pada perkakasan moden. Walaupun pada telefon pintar, ia biasanya mengambil masa 1 hingga 3 saat. Satu foto boleh mengandungi ratusan item, semuanya dikira dalam satu laluan.

Matematinya tidak seimbang. Tugas yang memerlukan pasukan empat orang selama satu hari kerja 8 jam, kira-kira 2,500 SKU, boleh diselesaikan dalam beberapa minit apabila setiap rak difoto dan diproses. Bottleneck beralih daripada mengira kepada memfoto.

Warehouse worker in safety vest looking up at tall shelves stacked with hundreds of boxes, showing the scale of manual inventory counting

Di mana pengiraan AI menghadapi kesukaran

Pengiraan AI tidak sempurna. Mengetahui kelemahan ia membantu anda memutuskan bila untuk mempercayainya dan bila untuk mengesahkan hasilnya.

Objek bertindih dan bertindan

Model hanya melihat apa yang ada di permukaan. Item yang tertimbus di bawah tidak kelihatan kepada kamera. Penyelidikan ICCV 2025 mengesahkan objek bertindan kekal sebagai salah satu masalah pengiraan yang paling sukar.

Objek yang sangat kecil

Item di bawah kira-kira 20 piksel dalam imej menjadi sukar dibezakan daripada hingar. Foto resolusi tinggi membantu, tetapi ada had praktikalnya.

Pemandangan padat dan bersepah

Apabila objek berhimpit, model mungkin menggabungkan item bersebelahan menjadi satu pengesanan atau terlepas objek yang tersepit antara yang lain.

Item lutsinar atau memantulkan cahaya

Kaca, plastik jernih, dan permukaan berkilat tidak mempunyai tepi yang jelas, menyebabkan kiraan terlepas atau kiraan hantu.

Kuantiti sangat tinggi dalam satu bingkai

Kiraan melebihi 1,000 dalam satu imej membesarkan kesilapan kecil per objek menjadi jumlah yang ketara. Membahagikan kepada beberapa foto menyelesaikan masalah ini.

Bila mengira secara manual masih menang

AI memerlukan objek yang kelihatan dalam foto. Ada situasi di mana pertimbangan manusia masih menjadi alat yang lebih baik:

Kurang daripada 10 item - Kebolehan subitizing otak anda menjadikan pandangan sekilas lebih pantas daripada mana-mana aplikasi.
Objek tersembunyi sepenuhnya - Item di dalam kotak tertutup, di belakang dinding, atau di bawah item lain tidak kelihatan kepada kamera.
Timbunan campuran tidak teratur - Kumpulan objek yang sangat berbeza dalam orientasi rawak boleh mengelirukan model yang mengharapkan konsistensi visual.
Tiada kamera tersedia - Kadang-kadang cara terpantas ialah mengira secara manual.

Garis pembahagi praktikal: jika semua objek kelihatan jelas dan bilangannya melebihi kira-kira 20, AI hampir sentiasa memberikan hasil yang lebih pantas dan lebih tepat.

Person holding a smartphone to photograph small electronic components spread on a dark surface, showing how easy it is to count objects with a phone

Kesimpulan

Pengiraan berkuasa AI kini lebih pantas, lebih tepat, dan lebih konsisten berbanding pengiraan manual untuk kebanyakan senario praktikal. Kekangan yang tinggal adalah nyata tetapi difahami dengan baik, dan semakin mengecil dengan setiap generasi model baharu.

Lain kali anda berhadapan dengan rak berisi komponen, dulang berisi alat ganti, atau palet berisi kotak, cuba ambil foto dan bukannya mengira secara manual. Anda akan mendapat jawapan dalam beberapa saat, dan ia mungkin lebih tepat daripada kiraan anda.

Pengiraan AI Computer Vision Pengesanan Objek Cara Ia Berfungsi

Bagaimana AI mengira objek dalam foto (dan mengapa ia lebih hebat daripada anda)

Apa yang berlaku apabila anda memuat naik foto

Jurang ketepatan: mengapa AI mengatasi mata anda

Kelajuan: minit lawan saat

Di mana pengiraan AI menghadapi kesukaran

Bila mengira secara manual masih menang

Kesimpulan

Anda mungkin juga suka

Pengiraan Manual vs. AI: Bila Perlu Mempercayai Algoritma

Kira panel solar daripada foto dron dengan AI

Mengira kayu balak dengan AI: inventori kayu lebih pantas