hquang ơi ông đọc bài meta pseudo label chưa cho tôi hỏi cái này với
Nếu thay chỉ gs(y^u)g_s(\hat{y}_u)gs(y^u) vào pt (7) thì θs\theta_sθs mất đi đâu rồi nhỉ ?
PT (10) này thì làm như nào để từ dấu = thứ 2, ra được dấu bằng thứ 3 thế :
cái đầu do tham số hiện tại của student không phụ thuộc vào teacher nên tính đạo hàm triệt tiêu
cái thứ 2 thì do định nghĩa của cross entropy thôi. CE giữa y_hat và output của teacher là -log xác suất teacher gán có y_hat
tôi hiểu rồi, cảm ơn ông nhé. Tôi đang định viết 1 bài về meta pseudo label để thông não bằng toán, tôi sai chỗ nào thì vào góp ý với nhé =))
Tổng số lượt xem bài viết
6.5K
Reputations
370
Các thẻ theo dõi
5
Đang theo dõi các người dùng
0
Các người dùng đang theo dõi
14
Bài viết
6
Bookmark
Tổng số câu hỏi
Tổng số câu trả lời
hquang ơi ông đọc bài meta pseudo label chưa cho tôi hỏi cái này với
Nếu thay chỉ gs(y^u) vào pt (7) thì θs mất đi đâu rồi nhỉ ?
PT (10) này thì làm như nào để từ dấu = thứ 2, ra được dấu bằng thứ 3 thế :
cái đầu do tham số hiện tại của student không phụ thuộc vào teacher nên tính đạo hàm triệt tiêu
cái thứ 2 thì do định nghĩa của cross entropy thôi. CE giữa y_hat và output của teacher là -log xác suất teacher gán có y_hat
tôi hiểu rồi, cảm ơn ông nhé. Tôi đang định viết 1 bài về meta pseudo label để thông não bằng toán, tôi sai chỗ nào thì vào góp ý với nhé =))