Team 03:

Thành Viên:

Đoàn Phú Đức
Dat Tran
Duong Le Tuong Khang
Quang Long Nguyen

Pipeline:

Treo colab để chạy videoXX.mp4 ra thành các frame ảnh và nén thành 1 file .zip để tiện xử lý
Dùng file zip ở trên và pretrained EfficientDetD4 để inference các bbox có trên từng frame rồi lưu vào 1 file txt
Chạy DeepSort đọc thông tin từ file cam_XX.txt để lấy thông tin các bbox của từng video. Sau đó áp dụng tracking rồi đưa ra kq ở file tracking_cam_XX.txt
Chạy file counting.py trên github mình đề cập dưới đây để tạo ra result_Cam_xX.txt từ file tracking
Merge các file result_cam_XX.txt thành 1 file duy nhất rồi nộp bài.

Labeling:

Sử dụng công cụ labelme để gán nhãn dữ liệu Số lượng đối tượng dán nhãn: 1. Motor 2. Car 3. Truck 4. Bus 5. Bicycle Số lượng ảnh thực hiện:

Ảnh ban ngày: Cam 1-5: mỗi cam thực hiện label 1000 tấm. Nguyên tắc label ảnh sẽ chọn khoảng cách 5 frame hình sẽ tiến hành gán nhãn một ảnh. Ví dụ: cam 1 sẽ label các frame 0000.jpg 0005.jpg 0010.jpg...
Ảnh ban đêm: Cam 9-10: tổng label 4000 tấm. Nguyên tắc label xe:
NT1: Label tất cả những đối tượng có trên ảnh mà mắt có thể nhận diện được
NT2: Thống nhất phạm vi label đối tượng cho từng cam trước khi tiến hành label
NT3: Không label những đối tượng quá nhỏ, bị che hay chói trên ảnh.
NT4: khi label đối tượng ban đêm, dựa vào đèn xe làm cơ sở label đối tượng, trừ các trường hợp đèn xe bị che hay xe đạp.

Thống nhất label đối tượng motor: Bao gồm xe 2 bánh và xe 3
Thống nhất label đối tượng car: xe 4 bánh
Thống nhất label đối tượng truck:Xe chở hàng
Thống nhất label đối tượng bus: Xe bus công cộng chở người số lượng lớn, xe khách
Thống nhất label đối tượng bicycle:Xe đạp, xe đạp điện.

Stage 1: Detection

Colab: Baseline_EfficientDet

Sử dụng pretrained model Efficientdet-d4 để thực hiện detection

Nhận xét:

Model detect khá tốt car, bus, truck. Tuy vậy lại bỏ qua khá nhiều motor, điều này ảnh hưởng đến việc tracking ở bước tiếp theo.
Ở cam 09 và cam 10 ( 2 cam tối), model detect kém, bỏ qua khá nhiêu xe và bị nhiễu khá nhiều. Vì vậy nhóm đã quyết định thực hiện lại việc label dữ liệu, train lại model để cải thiện khả năng detect ở cam 09 và cam 10, đồng thời tăng detect xe máy.

Colab: train_efficientdet

Train model với dữ liệu được gán nhãn
Dữ liệu được gán nhãn ở cam 01, cam 02, cam 03, cam 04, cam 09 và cam 10. Các nhãn được gán là: Bicycle, Motor, Truck, Bus, Car và ở bước detection được chuyển thành 4 class như yêu cầu ở cuộc thi HCMcity AI Challenges.
Link dataset cam 10, fullcam(cam 01 + cam 02 + cam 03 + cam 04 + cam 09 + 1 phần cam 10 (khoảng 2000 tấm): https://drive.google.com/drive/folders/1GGI2TXdGIdsCXGqaMl1IvT6ETytQTDyK?usp=sharing

Training:

Nhóm thực hiện theo 2 cách:
- Cách 1: chỉ train với dữ liệu cam 10 ( cam 10 nhóm label được khoảng trên 4000 tấm) và dùng dữ liệu đó detect cho cam 10. (link file pth: và onnx: https://drive.google.com/drive/folders/1-34bMb8YwSLPlfpc9Zd2OzjbAtZxMb5l?usp=sharing )
- Cách 2: train với toàn bộ dữ liệu cam 01, cam 02, cam 03, cam 04, cam 09, cam 10 ( cam 01 -> cam 09: mỗi cam khoảng 200 tấm) và thực hiện detect lại cho toàn bộ dataset.( link pth và onnx: https://drive.google.com/drive/folders/1Xf0XT2EV2ChKSAR5h6k2wwPvRdEteij4?usp=sharing )

Nhận xét:

Sau khi thực hiện train lại, model đã có thể detect tốt hơn ở cam 09 và cam 10 ( cải thiện score sau khi thực hiện train lại).
Tuy vậy, điểm số cải thiện không nhiều. Điều này có thể do việc thực hiện fine-tuning không tốt, ảnh hưởng đến weight ban đầu của model.

Stage 2: Tracking

Sử lý từng camera và in ra files tracking_{cam_num}.txt theo thứ tự sau:

Đọc dữ liệu detections từ file {cam_num}.txt, file json và file zip chứa các frame ảnh.
Khởi tạo model DeepSort với weight pretrained đã được download ở trên
Mỗi frame, đưa mỗi box vào tracking để update tracking rồi in ra file txt theo định dạng: {track_id, x_min, y_min, x_max, y_max, frame_id, label} có nghĩa: id của tracking, {x_min, y_min, x_max, y_max} là box của tracking, id của frame và label của box tracking đấy.
Sau đó, chạy file moi_counting.py ở github được đề cập ở trên (https://github.com/wan2000/DeepSORT/tree/master/deep_sort) để lấy files result_{cam_num}.txt là kết quả cho camera thứ cam_num

Hạn chế của tracking hiện tại:

Khi đối tượng di chuyển tốc độ cao và có độ thay đổi lớn thì không hoạt động tốt
IOU metric hoạt động không tốt với đối tượng di chuyển nhanh.
Xác định hướng chưa chính xác

Hướng cải thiện:

Xây dựng tracker riêng cho từng class (Thiết kế transition matrix và prediction noise, hiết kế measurement matrix và measurement noise)
Cải thiện xác định hướng

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

Team 03:

Thành Viên:

Pipeline:

Labeling:

Stage 1: Detection

Colab: Baseline_EfficientDet

Nhận xét:

Colab: train_efficientdet

Training:

Nhận xét:

Stage 2: Tracking

Files

README.md

Latest commit

History

README.md

File metadata and controls

Team 03:

Thành Viên:

Pipeline:

Labeling:

Stage 1: Detection

Colab: Baseline_EfficientDet

Nhận xét:

Colab: train_efficientdet

Training:

Nhận xét:

Stage 2: Tracking