Về processing ảnh có lẽ bạn nên học qua lý thuyết gồm những điểm chính sau. Ah đầu tiên để trả lời thuật toán, bạn hoàn toàn có thể dựa vào đây để xem họ làm thế nào.


Mục tiêu là rõ hơn chủ đề của ảnh, bỏ nhiễu, dữu liệu thừa, phân cục miếng mảng.
https://towardsdatascience.com/image-pre-processing-c1aec0be3edf

Về pre-processing ảnh:

1. Tốt nhất là training trên cái ảnh ở hiện trường, ko đc lấy ảnh từ nơi khác ko phải hiện trường. Ví dụ bạn training ảnh biển số, cần chụp tại hiện trường nơi cái ảnh đc hình thành trong cam mà… train. Mặt người cũng vậy

2. Nếu ko có từ thiết bị. Vậy bắt buộc phải lấy tập ảnh từ người khác có. Vậy thêm yếu tố cắt khung để chọn gần với đối tượng. Cái này các công ty 5 năm cứ lấy anh chị e thưc tập ra làm. Năng suất là 2k cái/ngày

3. Tới phần chỉnh kích cỡ -> dễ rồi
.. sau đó là tùy bài toán bạn áp dụng các bước tiếp:4. Tăng tương phản, tăng xám- Dùng light sensor, tăng cái này lên của chính cam, tới khi coef của các diểm chọn trước đạt ngưỡng. Có thể dùng overflow.- Tăng xám với thuật look-up table- Tới ngưỡng khi nào các line xuất hiện. Hoặc phải map hoặc recognize ra đường thẳng

4. Biến đổi hình học- Đơn giản là pixel của 1 img tại 1 thời điểm map với 1 thời điểm khác- 1 điểm ko đc, cho nhiều điểm.- Dùng bilinear hoăc affine transform

5. Phân ngưỡng- Tìm điểm khác biệt với điểm hiện tại. Dò thôi. Lại scan toàn ảnh. Tool select của photoshop là ví dụ- Các pixel có thể dùng SVM để classify

6. Khử nhiễu- Đơn giản là flat cái ảnh cho ko có chấm, sạn. Như vậy gần như ảnh đc vector toàn pixel. Và gần như ko có pixel nữa.

7. Biến đổi âm bản- Segment tốt khi tối ưu (6)

8. Cắt trích bit- Segment tốt khi đó mới tách các khối đc

Đọc qua: https://pdfs.semanticscholar.org/cc43/a71e05cfc49ab0777b82ca94d181f779149f.pdfhttps://www.slideshare.net/ASHI14march/image-pre-processing

Comments

comments