Sự khác biệt giữa kết quả đếm 78% và 98% thường không phải do AI - mà do bức ảnh.
Công cụ đếm AI xử lý chính xác những gì bạn cung cấp. Một bức ảnh sắc nét, đủ sáng với các vật thể tách biệt rõ ràng sẽ cho kết quả đếm gần như hoàn hảo. Một bức ảnh mờ, tối với đống vật chồng lên nhau chỉ cho ra kết quả phỏng đoán. Nghiên cứu từ bộ benchmark SNAP xác nhận rằng điều kiện chụp - ánh sáng, độ phơi sáng và góc máy ảnh - ảnh hưởng đáng kể đến hiệu suất mô hình deep learning, đôi khi còn hơn cả kiến trúc mô hình. Tin tốt là: việc cải thiện ảnh hoàn toàn miễn phí, nhanh chóng và hiệu quả vượt trội.
1. Trải vật thể thành một lớp duy nhất
Chồng chéo là nguyên nhân số một gây đếm thiếu. Khi hai con bu lông nằm chồng lên nhau, camera chỉ nhìn thấy một hình dạng. AI không thể đếm những gì nó không nhìn thấy.
Trước khi chụp, hãy dành 10 giây trải các vật thể thành một lớp phẳng duy nhất. Đẩy chúng ra xa nhau cho đến khi bạn thấy được một khe nhỏ phông nền giữa từng cái. Chỉ riêng điều này có thể cải thiện độ chính xác thêm 10 đến 15 điểm phần trăm trên những cảnh dày đặc.
Nếu bạn nhìn thấy từng vật thể riêng lẻ từ trên xuống, AI cũng vậy. Nếu hai vật trông như một hình dạng, AI sẽ đếm chúng là một.
2. Chụp thẳng từ trên xuống
Méo phối cảnh rất khó nhận ra. Khi bạn chụp một khay ốc vít ở góc 45 độ, những con ốc phía sau trông nhỏ hơn và sát nhau hơn so với phía trước. Mô hình AI xử lý kích thước pixel, nên vật thể trông nhỏ hơn sẽ bị phát hiện kém chính xác hơn.
Giữ điện thoại hoặc máy ảnh song song với bề mặt, hướng thẳng xuống. Hầu hết smartphone đều có tùy chọn lưới hỗ trợ trong cài đặt camera - hãy bật lên và căn chỉnh các cạnh bề mặt theo đường lưới. Ảnh chụp thẳng từ trên xuống giúp mọi vật thể có cùng kích thước pixel và loại bỏ sự che khuất do chiều sâu.

3. Sử dụng phông nền tương phản
Phát hiện vật thể hoạt động bằng cách tìm các cạnh - ranh giới nơi một màu gặp màu khác. Khi vật thể hòa lẫn vào phông nền, những cạnh đó biến mất.
Cách khắc phục rất đơn giản: dùng màu đối lập. Vật tối đặt trên bề mặt sáng. Vật sáng đặt trên bề mặt tối. Một tờ giấy trắng cho ốc vít tối màu, một tấm vải đen cho vòng đệm bạc. Tránh phông nền xanh lá, vì có thể gây tràn màu làm AI nhầm lẫn ranh giới vật thể. Độ tương phản càng rõ, việc phát hiện càng chính xác.
4. Dùng ánh sáng đều và khuếch tán
Ánh sáng trực tiếp mạnh gây ra hai vấn đề: điểm sáng chói làm mất chi tiết và bóng tối che khuất vật thể hoàn toàn. Một bóng đổ ngang qua hàng viên thuốc có thể chia một vật thể thành hai hình dạng được phát hiện, hoặc làm một vật thể biến mất.
Ánh sáng tốt nhất để chụp ảnh đếm là mềm và đều. Gần cửa sổ vào ngày nhiều mây là lý tưởng. Trong nhà, đèn huỳnh quang trần hoặc tấm LED hoạt động tốt. Nếu chỉ có đèn bàn, hãy hắt sáng lên tường trắng hoặc trần nhà thay vì chiếu thẳng vào vật thể. Mục tiêu là độ sáng đồng đều không có bóng đổ rõ ràng giữa các vật.

5. Đếm theo lô với số lượng lớn
Cố nhét 500 vật thể vào một bức ảnh nghĩa là mỗi vật chỉ chiếm rất ít pixel. Vật thể dưới khoảng 20 pixel trở nên khó phân biệt với nhiễu hoặc kết cấu phông nền. Mỗi vật càng nhỏ trong ảnh, mô hình càng gặp khó khăn.
Với số lượng trên 100, hãy chia thành các lô 50 đến 100 mỗi ảnh. Đếm từng lô riêng rồi cộng tổng lại. Điều này giữ cho mỗi vật thể đủ lớn để phát hiện đáng tin cậy và hạn chế hiệu ứng cộng dồn từ những sai số nhỏ. Năm bức ảnh mỗi tấm 100 vật sẽ cho tổng chính xác hơn một bức ảnh 500 vật.
6. Tắt đèn flash
Đèn flash điện thoại phát sáng từ một nguồn điểm ngay cạnh ống kính. Điều này tạo ra điểm sáng chói ở giữa và bóng đổ mạnh ở rìa - chính xác là điều kiện ánh sáng làm giảm độ chính xác phát hiện.
Flash còn tạo phản xạ lóa trên bề mặt bóng hoặc kim loại, biến đầu ốc vít thành một vệt trắng mà AI không thể phân loại. Hãy tắt flash và sử dụng ánh sáng tự nhiên. Nếu cảnh quá tối, thêm một nguồn sáng riêng đặt phía trên và hơi lệch sang bên, hoặc di chuyển đến khu vực sáng hơn.
7. Đảm bảo lấy nét sắc nét
Ảnh mờ làm nhòe các cạnh giữa các vật thể, chính xác là thông tin mà AI cần để phát hiện ranh giới. Ngay cả hiện tượng mờ chuyển động nhẹ từ tay run cũng có thể giảm độ chính xác trên các vật nhỏ.
Chạm vào màn hình để khóa lấy nét vào vật thể trước khi chụp. Giữ điện thoại vững, hoặc tựa vào một bề mặt. Với những lần đếm quan trọng, sử dụng hẹn giờ 2 giây để loại bỏ rung khi nhấn nút chụp. Độ phân giải từ 2.000 pixel trở lên ở cạnh dài nhất đảm bảo AI có đủ chi tiết để xử lý, dù 1.000 pixel cũng đủ dùng cho các vật thể lớn hơn.

Tổng hợp tất cả
- Trải vật thể thành một lớp với khoảng cách rõ ràng
- Giữ camera thẳng phía trên
- Đặt vật thể trên phông nền tương phản
- Dùng ánh sáng mềm, đều, không có bóng đổ mạnh
- Chia số lượng lớn thành các lô 50 đến 100
- Tắt đèn flash
- Chạm để lấy nét và giữ vững tay
Không mẹo nào trong số này yêu cầu thiết bị đặc biệt. Một chiếc smartphone, một tờ giấy và một cửa sổ là đủ. Hiệu quả tổng hợp rất ấn tượng: người dùng tuân thủ các hướng dẫn này thường xuyên báo cáo độ chính xác trên 95%, so với 75 đến 85% khi chụp tùy tiện.
Lần tới khi bạn cần đếm vật thể từ ảnh, hãy dành 30 giây để chuẩn bị bức ảnh. Nửa phút đầu tư đó giúp bạn tránh phải đếm lại, nghi ngờ kết quả, và tin vào một con số có thể sai lệch 20%. AI đã sẵn sàng. Hãy cho nó một bức ảnh đáng để đếm.