GAP và Softmax trong ResNet

Question

Chào tất cả mọi người, hiện tại em đang tìm hiểu về ResNet và khi em nhìn vào paper, có 1 tấm hình về architecture của ResNet.

Accepted Answer

Hàm softmax thường được sử dụng cho các bài toán phân loại, mình nghĩ vấn đề ở đây không phải là do softmax mà do lớp 1000d-fc. Bạn thử thay lớp đó thành bằng với num classes của tập dataset và thay optimizer bằng Adam thử xem

Answer

Có rất nhiều vấn đề trong câu hỏi của bạn
1. "em tìm hiểu trên mạng thì thấy mọi người không sử dụng (...) average pool". Mình dạo qua 2 lib cực nổi tiếng bên CV là timm và MMPretrain thì đều thấy họ sử dụng AvgPool cho Resnet:
- MMPretrain: `https://github.com/open-mmlab/mmpretrain/blob/main/configs/_base_/models/resnet50.py`
- timm: https://github.com/huggingface/pytorch-image-models/blob/main/timm/layers/classifier.py#L55
2. "em tìm hiểu trên mạng thì thấy mọi người không sử dụng softmax (...) thì cho ra kết quả rất tốt". Bạn train sử dụng loss gì và khi thực hiện inference thì bạn thực hiện như nào? Nếu bạn vừa sử dụng softmax vừa sử dụng CrossEntropyLoss của Pytorch thì rõ ràng là bạn đã sử dụng sai cách. Bạn có thể đọc về CrossEntropyLoss để hiểu rõ hơn

2 CÂU TRẢ LỜI