Thảo luận

Cuộc sống mà

đã bình luận cho bài viết

Vuejs và những kiến thức cho người mới bắt đầu(P2) của

Nguyen Quang Phu

thg 5 19, 2020 7:32 SA

Nguyen Viet Anh

đã bình luận cho bài viết

Transformers - "Người máy biến hình" biến đổi thế giới NLP của

Nguyen Viet Anh

thg 5 19, 2020 6:35 SA

Ở sub-layer #1 của Decoder nhận vector K và V của Encoder như 2 feature vectors cho cả câu input, còn vector Q sẽ được lấy từ output. Bạn có thể thấy điều này trong kiến trúc tổng quan Transformers (sau khi ra khỏi Encoder có 2 mũi tên nối vào Decoder là K và V). Thêm nữa, output của self-attention là vector Z là dot product của softmax và V chứ không còn là V nữa bạn nhé.
Input của Decoder chính là output của nó từ những time steps trước, và nó phải predict ra token tiếp theo. Bạn xem ảnh GIF Decoding ở trên sẽ thấy, để sinh ra từ "a", decoder cần input ["I", "am"], sau đó nó lại lấy ["I", "am", 'a"] để sinh ra "student".

Nguyen Thanh Hai

đã bình luận cho bài viết

Multisig Wallet là gì? của

Do Trung Kien

thg 5 19, 2020 6:32 SA

Rất tiếc ko có 1 hardfork thứ 2 như theDAO cho vụ multisig wallet của Parity (lol)

Nhat Tran

đã bình luận cho bài viết

Hack game half life với C++ (phần 1) của

Mint

thg 5 19, 2020 6:16 SA

hay quá bạn

Bui Tien Tung

đã bình luận cho bài viết

Quantum Machine Learning - Khi Vật Lý Lượng Tử Và Machine Learning Gặp Nhau của

Dark Knight

thg 5 19, 2020 5:54 SA

em cũng không hiểu gì hết =(((

Hùng Nguyễn Mạnh

đã bình luận cho bài viết

Transformers - "Người máy biến hình" biến đổi thế giới NLP của

Nguyen Viet Anh

thg 5 19, 2020 4:06 SA

Bài viết của anh rất hay ạ! Nhưng sau khi đọc xong em có chút thắc mắc ở câu này "Sau khi masked input đưa qua sub-layer #1 của Decoder, nó sẽ không nhân với 3 ma trận trọng số để tạo ra Q, K, V nữa mà chỉ nhân với 1 ma trận trọng số WQ.". Theo em được tìm hiểu thì các vecto K, Q vẫn sẽ được tạo ra trong quá trình self-attention. Qua bước self-attention này họ chỉ lấy vecto V của self-attention rồi đưa vào Encode-Decode layer attention. Thêm nữa em có một câu hỏi. Trong quá trình training thì ta có biết được nhãn của output rồi nên ta có thể đưa vào input_decode của Decode layer. Nhưng trong quá trình predict thì không biết nhãn trước của câu thì Decode nó sẽ hoạt động như thế nào. Anh có thể giải thích giúp em 2 vấn đề trên với ạ. Em xin cảm ơn.

Kiên Lưu

đã bình luận cho bài viết

[AI Interview] 12 câu hỏi phỏng vấn Deep Learning siêu hay không thể bỏ qua của

Phạm Văn Toàn

thg 5 19, 2020 3:07 SA

cảm ơn add

Nguyễn Hữu Kim

đã bình luận câu trả lời trong câu hỏi

Cách Khác phục lỗi 302 khi up code lên host ! của

Nguyễn Hữu Kim

thg 5 19, 2020 3:05 SA

Không có gì ạ

Truong Bui

đã bình luận câu trả lời trong câu hỏi

Cách Khác phục lỗi 302 khi up code lên host ! của

Nguyễn Hữu Kim

thg 5 19, 2020 3:03 SA

Cảm ơn bác. Do lỗi phông chữ từ database trên host, nó không login được xong em return else về login đâm ra nó mới thế. cảm ơn bác nhiều.

Huy

đã bình luận cho bài viết

Active Record : Trái tim của Rails của

Huy Thành

thg 5 19, 2020 2:19 SA

Mình nghĩ bạn nên lấy nhiều tên làm ví dụ cho các hoạt động khác nhau, chứ cái nào cũng thấy huythanh rối quá

Việt Hoàng

đã bình luận cho bài viết

[MaskRCNN] Các bước triển khai training model MaskRCNN cho bài toán segmentation của

Việt Hoàng

thg 5 19, 2020 1:05 SA

cảm ơn bạn )

Đỗ Thanh

đã bình luận cho bài viết

Từ Android source code đến binary-code. Lý do iOS nhanh hơn Android. của

Đỗ Thanh

thg 5 18, 2020 11:55 CH

Hoang Anh Tuan

đã bình luận cho bài viết

Từ Android source code đến binary-code. Lý do iOS nhanh hơn Android. của

Đỗ Thanh

thg 5 18, 2020 7:10 CH

Idol đỉnh quá

Trịnh Lân

đã bình luận cho bài viết

3 lầm tưởng của sinh viên năm nhất về ngành IT của

Trịnh Lân

thg 5 18, 2020 4:43 CH

Cám ơn bạn đã quan tâm

Trần Đình Vinh

đã bình luận cho bài viết

Cùng học RxJava, phần 2: Threading concept của

Nguyen Thanh Hai

thg 5 18, 2020 4:08 CH

hay quá a, 2020 rồi vẫn giữ nguyên giá trị

Minh Tuấn Ngụy

đã bình luận cho bài viết

Bạn đã thực sự "biết" HTTP Response Status Code? của

Vương Minh Thái

thg 5 18, 2020 2:36 CH

@huusu1996 anh biết 418 status code k =))

James Riddie Harry

đã bình luận cho bài viết

3 lầm tưởng của sinh viên năm nhất về ngành IT của

Trịnh Lân

thg 5 18, 2020 2:14 CH

Cảm ơn bạn đã chia sẻ nha. Mình học lớp 12 có nguyện vọng học IT nên có nhiều điều chưa biết rõ. Qua bài viết của bạn mình đã hiểu rõ thêm phần nào rồi

Nhật Nguyễn

đã bình luận cho bài viết

TÌM HIỂU VỀ STORED PROCEDURE TRONG MYSQL của