กลับไปยังบทความทั้งหมด

7 เทคนิคถ่ายรูปที่ช่วยเพิ่มความแม่นยำในการนับด้วย AI เป็นสองเท่า

ความแตกต่างระหว่างผลนับ 78% กับ 98% มักไม่ได้อยู่ที่ AI แต่อยู่ที่รูปถ่าย เคล็ดลับ 7 ข้อนี้จะแก้ไขข้อผิดพลาดที่พบบ่อยที่สุด

list ในบทความนี้

ความแตกต่างระหว่างผลนับ 78% กับ 98% มักไม่ได้อยู่ที่ AI - แต่อยู่ที่รูปถ่าย

เครื่องมือนับด้วย AI ประมวลผลตามสิ่งที่คุณป้อนให้ทุกประการ รูปที่คมชัด แสงดี วัตถุแยกจากกันชัดเจน จะให้ผลนับที่ใกล้เคียงสมบูรณ์แบบ รูปที่เบลอ มีเงา วัตถุซ้อนทับกัน จะให้ผลแค่การคาดเดา งานวิจัยจาก SNAP benchmark ยืนยันว่าสภาพการถ่ายภาพ ทั้งแสง, การเปิดรับแสง และมุมกล้อง ส่งผลต่อประสิทธิภาพของโมเดล deep learning อย่างมาก บางครั้งมากกว่าสถาปัตยกรรมของโมเดลเสียอีก ข่าวดีคือ: การปรับปรุงรูปถ่ายไม่เสียค่าใช้จ่าย ทำได้เร็ว และให้ผลอย่างมหาศาล

1. กระจายวัตถุเป็นชั้นเดียว

การซ้อนทับเป็นสาเหตุอันดับหนึ่งของการนับขาด เมื่อสลักเกลียวสองตัววางซ้อนกัน กล้องจะเห็นเป็นรูปร่างเดียว AI ไม่สามารถนับสิ่งที่มองไม่เห็น

ก่อนถ่ายรูป ใช้เวลา 10 วินาทีกระจายสิ่งของออกเป็นชั้นเดียวแบนราบ ดันชิ้นส่วนออกจากกันจนมองเห็นพื้นหลังระหว่างแต่ละชิ้น เพียงแค่นี้ก็สามารถเพิ่มความแม่นยำได้ 10 ถึง 15 จุดเปอร์เซ็นต์ในฉากที่หนาแน่น

ทดสอบเร็ว

ถ้าคุณมองเห็นวัตถุแต่ละชิ้นได้จากด้านบน AI ก็มองเห็นเช่นกัน ถ้าสองชิ้นดูเหมือนรูปร่างเดียว AI จะนับเป็นหนึ่ง

2. ถ่ายจากด้านบนตรงๆ

การบิดเบือนจากมุมมองเป็นเรื่องแอบแฝง เมื่อคุณถ่ายถาดสกรูที่มุม 45 องศา สกรูด้านหลังจะดูเล็กกว่าและชิดกันมากกว่าด้านหน้า โมเดล AI ประมวลผลขนาดพิกเซล ดังนั้นวัตถุที่ดูเล็กกว่าจะถูกตรวจจับได้น้อยลง

ถือโทรศัพท์หรือกล้องให้ขนานกับพื้นผิว ชี้ตรงลงมา สมาร์ทโฟนส่วนใหญ่มีตัวเลือกเส้นกริดในการตั้งค่ากล้อง - เปิดใช้แล้วจัดขอบพื้นผิวให้ตรงกับเส้นกริด การถ่ายจากด้านบนโดยตรงทำให้ทุกวัตถุมีขนาดพิกเซลเท่ากันและขจัดการบังจากความลึก

Smartphone held directly above a tray of small hardware parts, showing the ideal overhead angle for AI object counting

3. ใช้พื้นหลังที่ตัดกัน

การตรวจจับวัตถุทำงานโดยการหาขอบ ซึ่งเป็นรอยต่อที่สีหนึ่งพบกับอีกสี เมื่อวัตถุกลืนกับพื้นหลัง ขอบเหล่านั้นจะหายไป

วิธีแก้ง่ายมาก: ใช้สีตรงข้าม วัตถุสีเข้มวางบนพื้นสีอ่อน วัตถุสีอ่อนวางบนพื้นสีเข้ม กระดาษสีขาวสำหรับสกรูสีเข้ม ผ้าสีดำสำหรับแหวนรองสีเงิน หลีกเลี่ยงพื้นหลังสีเขียวซึ่งอาจทำให้เกิดการเหลื่อมของสีที่ทำให้ AI สับสนกับขอบวัตถุ ยิ่งคอนทราสต์คมชัดเท่าไหร่ การตรวจจับก็ยิ่งแม่นยำเท่านั้น

4. ใช้แสงสม่ำเสมอแบบกระจาย

แสงตรงที่รุนแรงสร้างปัญหาสองอย่าง: จุดสว่างจ้าที่ทำให้รายละเอียดหายไป และเงาทึบที่ซ่อนวัตถุทั้งหมด เงาที่ตกทับแถวยาเม็ดอาจทำให้วัตถุหนึ่งถูกแยกเป็นสองรูปร่าง หรือทำให้วัตถุหายไปเลย

แสงที่ดีที่สุดสำหรับรูปถ่ายนับคือแสงนุ่มและสม่ำเสมอ ใกล้หน้าต่างในวันที่มีเมฆมากเป็นสภาพที่เหมาะสม ในร่ม ไฟฟลูออเรสเซนต์เพดานหรือแผง LED ใช้ได้ดี ถ้ามีแค่โคมไฟตั้งโต๊ะ ให้สะท้อนแสงจากผนังสีขาวหรือเพดานแทนการส่องตรงไปที่วัตถุ เป้าหมายคือความสว่างสม่ำเสมอโดยไม่มีเงาที่มองเห็นได้ระหว่างชิ้นส่วน

Two side-by-side photos of the same objects, one with harsh shadows from direct light and one with even diffused lighting showing how lighting affects visibility

5. นับเป็นชุดสำหรับจำนวนมาก

การพยายามใส่ 500 ชิ้นในรูปเดียวหมายความว่าแต่ละวัตถุจะมีพิกเซลน้อยมาก วัตถุที่มีขนาดต่ำกว่าประมาณ 20 พิกเซลจะยากที่ AI จะแยกแยะจากสัญญาณรบกวนหรือพื้นผิวพื้นหลัง ยิ่งแต่ละชิ้นดูเล็กเท่าไหร่ โมเดลก็ยิ่งทำงานยากขึ้นเท่านั้น

สำหรับจำนวนมากกว่า 100 ให้แบ่งเป็นชุดละ 50 ถึง 100 ต่อรูป นับแต่ละชุดแยกกันแล้วรวมยอด วิธีนี้ทำให้ทุกวัตถุมีขนาดใหญ่พอสำหรับการตรวจจับที่เชื่อถือได้ และจำกัดผลกระทบสะสมจากข้อผิดพลาดเล็กน้อย ห้ารูปรูปละ 100 ชิ้นจะให้ผลรวมที่แม่นยำกว่าหนึ่งรูปที่มี 500 ชิ้น

6. อย่าใช้แฟลช

แฟลชโทรศัพท์ส่องจากแหล่งจุดเดียวข้างเลนส์ สิ่งนี้สร้างจุดสว่างจ้าตรงกลางและเงาทึบที่ขอบ ซึ่งเป็นสภาพแสงที่ลดความแม่นยำในการตรวจจับ

แฟลชยังสร้างแสงสะท้อนจ้าบนพื้นผิวมันหรือโลหะ ทำให้หัวสกรูกลายเป็นจุดสีขาวที่ AI จำแนกไม่ได้ ปิดแฟลชแล้วใช้แสงธรรมชาติ ถ้าฉากมืดเกินไป ให้เพิ่มแหล่งแสงแยกวางไว้ด้านบนเยื้องไปด้านข้างเล็กน้อย หรือย้ายไปบริเวณที่สว่างกว่า

7. ให้แน่ใจว่าโฟกัสคมชัด

รูปเบลอทำให้ขอบระหว่างวัตถุเลือนหาย ซึ่งเป็นข้อมูลที่ AI ต้องใช้เพื่อตรวจจับขอบเขต แม้แต่ภาพเบลอจากการสั่นของมือเพียงเล็กน้อยก็สามารถลดความแม่นยำกับวัตถุขนาดเล็กได้

แตะหน้าจอเพื่อล็อกโฟกัสที่วัตถุก่อนกดถ่าย ถือโทรศัพท์ให้นิ่ง หรือวางพิงพื้นผิว สำหรับการนับที่สำคัญ ให้ใช้ตั้งเวลา 2 วินาทีเพื่อกำจัดการสั่นจากการกดปุ่มชัตเตอร์ ความละเอียด 2,000 พิกเซลขึ้นไปที่ด้านยาวที่สุดจะช่วยให้ AI มีรายละเอียดเพียงพอ แม้ว่า 1,000 พิกเซลก็ใช้ได้สำหรับวัตถุขนาดใหญ่

Close-up comparison showing sharp and blurry photos of small metal parts, demonstrating how focus quality affects object detection

รวมทุกเคล็ดลับเข้าด้วยกัน

  • กระจายสิ่งของเป็นชั้นเดียวโดยมีช่องว่างที่มองเห็นได้
  • ถือกล้องตรงจากด้านบน
  • วางวัตถุบนพื้นหลังที่ตัดกัน
  • ใช้แสงนุ่มสม่ำเสมอไม่มีเงาทึบ
  • แบ่งจำนวนมากเป็นชุดละ 50 ถึง 100
  • ปิดแฟลช
  • แตะเพื่อโฟกัสและถือให้นิ่ง

ไม่มีเคล็ดลับใดที่ต้องใช้อุปกรณ์พิเศษ สมาร์ทโฟน กระดาษแผ่นเดียว และหน้าต่างก็เพียงพอ ผลรวมนั้นน่าทึ่ง: ผู้ใช้ที่ทำตามแนวทางเหล่านี้รายงานความแม่นยำสูงกว่า 95% อย่างสม่ำเสมอ เทียบกับ 75 ถึง 85% จากรูปถ่ายที่ไม่ได้เตรียมการ

ครั้งหน้าที่คุณต้องนับวัตถุจากรูปถ่าย ใช้เวลา 30 วินาทีจัดเตรียมรูป การลงทุนครึ่งนาทีนั้นช่วยให้คุณไม่ต้องนับซ้ำ ไม่ต้องสงสัยผล และไม่ต้องเชื่อตัวเลขที่อาจคลาดเคลื่อน 20% AI พร้อมแล้ว ให้มันได้รูปที่คุ้มค่าแก่การนับ