sử dụng AI để detect nội dung quảng cáo để chặn như thế nào?
Hiện tại mình đang có bài toàn về detect nội dung quảng cáo và chặn nó. Việc chặn thì chỉ là cách xử lý. Còn việc detect nội dung quảng cáo thì hơi ít kiến thức. Ai có kinh nghiệm, biết thì giới thiệu cho mình vs. Mình đang biết mỗi spam filter còn filter ads trên video thì ko?
1 CÂU TRẢ LỜI
Chào bạn, để xử lý vấn đề này, hiện nay đa số các bên mình biết đều đang sử dụng các phương pháp nhằm vector hóa bài viết, trích xuất đặc trưng từ bài viết đơn giản như TF-IDF hoặc Bag of words,.. Sau đó từ các vector này sẽ có thể sử dụng thuật toán SVM hoặc Naive Bayes hoặc Decision Tree để phân loại. Bạn có thể tìm hiểu thông qua một số nguồn sau:
TF-IDF: https://viblo.asia/p/tf-idf-term-frequency-inverse-document-frequency-JQVkVZgKkyd https://viblo.asia/p/machine-learning-trich-xuat-dac-trung-van-ban-part-1-oOVlYqzzl8W
Bag of words: https://codetudau.com/bag-of-words-tf-idf-xu-ly-ngon-ngu-tu-nhien/index.html https://medium.com/greyatom/an-introduction-to-bag-of-words-in-nlp-ac967d43b428 (bài viết bằng tiếng Anh)
Thuật toán phân loại SVM: https://viblo.asia/p/ung-dung-support-vector-machine-trong-bai-toan-phan-loai-hoa-PdbGnLXBkyA
Naive Bayes / Bag os words vào bài toán phân loại thư rác: https://viblo.asia/p/ly-thuyet-ve-mang-bayes-va-ung-dung-vao-bai-toan-loc-thu-rac-07LKXzkelV4
Github của mình về bài tương tự: https://github.com/hoanganhpham1006/IT_post_classification
Về phần ads trên video, sẽ phức tạp hơn nhiều, nhưng 1 cách tổng quan, phương pháp vẫn bao gồm 2 bước: trích xuất đặc trưng (vector hóa) và phân loại. Bạn có thể tìm hiểu kỹ hơn về vấn đề trích xuất đặc trưng video.
Chúc bạn thành công
Cảm ơn câu trả lời của bạn. Rất nhiệt tình. Mình thấy text thì ok còn video thì đúng là hơi khó nhằn.
Cho mình hỏi ads trên video của bạn ở dạng gì vậy?
@QuangPH mình nghĩa chắc chỉ có 2 dạng popup or nhúng vào trong. Nhúng vào thì công nhận khoai thật
@kstn_hut_hat nhúng vào video thì khó thật, còn popup thì mình vẫn k biết ngoài popup quảng cáo thì còn popup nào nữa để phân loại, có những loại nhãn nào. Còn popup mình lấy được ra text thì chỉ còn là vấn đề classify thôi 😊
@QuangPH mình còn nghĩ nó add popup vào thì code thông thường ko cần AI là đc rồi
@kstn_hut_hat mình đang nghĩ thế mà. Trừ khi có nhiều loại popup, có popup do chính người đăng video thêm vào để link tới 1 video khác của họ.
Tóm lại mình vẫn k hiểu bài toán của bạn lắm.