Saliency map sử dụng backprop để tính toán gradients, dựa vào backprop ta có thể làm nổi bật các pixel của hình ảnh đầu vào dựa trên lượng gradient mà chúng nhận được.
CNN-GAPs thì ta sẽ sử dụng thay vì dùng MP thì sẽ được dùng bằng GAP để tính toán, GAP chỉ đơn giản là tính trung bình các kích hoạt của từng feature map và nối các giá trị trung bình này và xuất chúng thành một vectơ. Sau đó, tổng trọng số của vector này được đưa đến softmax layer cuối cùng. Sử dụng kiến trúc này, ta có thể làm nổi bật các vùng quan trọng của hình ảnh bằng cách chiếu lại các trọng số của output trên các convolutional feature maps.
Bài viết rất hay nhưng mình có thắc mắc ở kiến trúc thứ 3 Network + Database mong bạn giúp đỡ
Như bạn nói thì quan sát database hết dữ liệu sẽ tải thêm. Vậy thì tải thêm làm sao biết được loadmore dữ liệu từ page bao nhiêu ? Nếu lưu giá trị page cuối cùng đã tải để sử dụng cho loadmore thì trường hợp dữ liệu thay đổi làm sao cập nhật data trước đó trong database ?
@Sosiii nếu bạn muốn chạy được interface thì cái interface đấy phải được activity implement và từ activity bạn phải truyền đối tượng interface ấy vào adapter
"Thực hiện global average pooling trên các features của các layers conv trước đó"
Global average pooling gần giống với Max Pooling là dùng để giảm các tham số trong model, nhưng nó sử dụng một phương pháp khá cực đoan là nếu tensor có số chiều là hxwxd thì khi qua GAP số chiều sẽ giảm xuống còn là 1x1xd. GAP layers giảm mỗi một hxw feature map xuống còn một số bằng cách lấy trung bình của tất cả các giá trị hw . Chúng ta sẽ lấy tất cả các features của các lp conv như mình ns ở trên cho qua GAP.
"Những features sau đó sẽ được cho vào tiếp một lớp fully-connected với hàm kích hoạt softmax, với cấu trúc đơn giản này ta sẽ xác định ra tầm quan trọng của vùng hình ảnh bằng projecting các weight của output layer lên convolutional feature maps mà đã thu được từ lớp chập cuối cùng." Tất cả những features từ GAP thu được ở trên thì sẽ được cho qua một lớp Dense cuối cùng với activation là softmax :v
Thực hiện global average pooling trên các features của các layers conv trước đó. Những features sau đó sẽ được cho vào tiếp một lớp fully-connected với hàm kích hoạt softmax, với cấu trúc đơn giản này ta sẽ xác định ra tầm quan trọng của vùng hình ảnh bằng projecting các weight của output layer lên convolutional feature maps mà đã thu được từ lớp chập cuối cùng.
Bạn có thể giải thích thêm đoạn này được không? Đọc mãi không hiểu gì :'<
THẢO LUẬN
mình ko có thời gian làm liên tục nên cũng ko nhớ chính xác nữa

nhìn chung thì mình tốn khá nhiều thời gian vào việc xử lý dữ liệu và phần post-processing
wth? ai đấy, để avatar gái nhận k ra =))
Đúng cái em đang cần,cám ơn bác Thiện nhé =))
Thím này toàn bài viết chất lượng quá, làm mình toàn mất công up vote xD
Saliency map sử dụng backprop để tính toán gradients, dựa vào backprop ta có thể làm nổi bật các pixel của hình ảnh đầu vào dựa trên lượng gradient mà chúng nhận được.
CNN-GAPs thì ta sẽ sử dụng thay vì dùng MP thì sẽ được dùng bằng GAP để tính toán, GAP chỉ đơn giản là tính trung bình các kích hoạt của từng feature map và nối các giá trị trung bình này và xuất chúng thành một vectơ. Sau đó, tổng trọng số của vector này được đưa đến softmax layer cuối cùng. Sử dụng kiến trúc này, ta có thể làm nổi bật các vùng quan trọng của hình ảnh bằng cách chiếu lại các trọng số của output trên các convolutional feature maps.
Còn lại bài viết rất hay ạ
Bài viết rất hữu ích . Cảm ơn sếp



lợi
Ở mục 5 hình như anh có nhầm lẫn chút xíu, theo em là other primitive value chứ ko phải là non-primitive value === reference value
với cả trong paper có so sánh với backprop saliency map ở Fig 5 và 6; bạn có thể giúp mình mô tả phương pháp được so sánh đó được không?
Bài viết rất hay nhưng mình có thắc mắc ở kiến trúc thứ 3 Network + Database mong bạn giúp đỡ Như bạn nói thì quan sát database hết dữ liệu sẽ tải thêm. Vậy thì tải thêm làm sao biết được loadmore dữ liệu từ page bao nhiêu ? Nếu lưu giá trị page cuối cùng đã tải để sử dụng cho loadmore thì trường hợp dữ liệu thay đổi làm sao cập nhật data trước đó trong database ?
cảm ơn bạn nhé.
@Sosiii nếu bạn muốn chạy được interface thì cái interface đấy phải được activity implement và từ activity bạn phải truyền đối tượng interface ấy vào adapter
"Thực hiện global average pooling trên các features của các layers conv trước đó" Global average pooling gần giống với Max Pooling là dùng để giảm các tham số trong model, nhưng nó sử dụng một phương pháp khá cực đoan là nếu tensor có số chiều là hxwxd thì khi qua GAP số chiều sẽ giảm xuống còn là 1x1xd. GAP layers giảm mỗi một hxw feature map xuống còn một số bằng cách lấy trung bình của tất cả các giá trị hw . Chúng ta sẽ lấy tất cả các features của các lp conv như mình ns ở trên cho qua GAP.
"Những features sau đó sẽ được cho vào tiếp một lớp fully-connected với hàm kích hoạt softmax, với cấu trúc đơn giản này ta sẽ xác định ra tầm quan trọng của vùng hình ảnh bằng projecting các weight của output layer lên convolutional feature maps mà đã thu được từ lớp chập cuối cùng." Tất cả những features từ GAP thu được ở trên thì sẽ được cho qua một lớp Dense cuối cùng với activation là softmax :v
ghê quá a Nghĩa ơi
Bạn có thể giải thích thêm đoạn này được không? Đọc mãi không hiểu gì :'<
thank bạn đã chia sẻ !
thank b đã chia sẻ
great post!