Yêu cầu Nov 26th, 2018 2:57 a.m. 227 0 1
  • 227 0 1
0

sử dụng AI để detect nội dung quảng cáo để chặn như thế nào?

Chia sẻ
  • 227 0 1

Hiện tại mình đang có bài toàn về detect nội dung quảng cáo và chặn nó. Việc chặn thì chỉ là cách xử lý. Còn việc detect nội dung quảng cáo thì hơi ít kiến thức. Ai có kinh nghiệm, biết thì giới thiệu cho mình vs. Mình đang biết mỗi spam filter còn filter ads trên video thì ko?

Nov 26th, 2018 3:22 a.m.

Cho mình hỏi ads trên video của bạn ở dạng gì vậy?

Avatar Anh Tuấn Hoàng @kstn_hut_hat
Nov 26th, 2018 3:27 a.m.

@QuangPH mình nghĩa chắc chỉ có 2 dạng popup or nhúng vào trong. Nhúng vào thì công nhận khoai thật 😄

Nov 26th, 2018 3:32 a.m.

@kstn_hut_hat nhúng vào video thì khó thật, còn popup thì mình vẫn k biết ngoài popup quảng cáo thì còn popup nào nữa để phân loại, có những loại nhãn nào. Còn popup mình lấy được ra text thì chỉ còn là vấn đề classify thôi 😊

Avatar Anh Tuấn Hoàng @kstn_hut_hat
Nov 26th, 2018 3:37 a.m.

@QuangPH mình còn nghĩ nó add popup vào thì code thông thường ko cần AI là đc rồi 😄

Nov 26th, 2018 3:39 a.m.

@kstn_hut_hat mình đang nghĩ thế mà. Trừ khi có nhiều loại popup, có popup do chính người đăng video thêm vào để link tới 1 video khác của họ.

Tóm lại mình vẫn k hiểu bài toán của bạn lắm.

1 CÂU TRẢ LỜI


Đã trả lời Nov 26th, 2018 3:05 a.m.
+1

Chào bạn, để xử lý vấn đề này, hiện nay đa số các bên mình biết đều đang sử dụng các phương pháp nhằm vector hóa bài viết, trích xuất đặc trưng từ bài viết đơn giản như TF-IDF hoặc Bag of words,.. Sau đó từ các vector này sẽ có thể sử dụng thuật toán SVM hoặc Naive Bayes hoặc Decision Tree để phân loại. Bạn có thể tìm hiểu thông qua một số nguồn sau:

TF-IDF: https://viblo.asia/p/tf-idf-term-frequency-inverse-document-frequency-JQVkVZgKkyd https://viblo.asia/p/machine-learning-trich-xuat-dac-trung-van-ban-part-1-oOVlYqzzl8W

Bag of words: https://codetudau.com/bag-of-words-tf-idf-xu-ly-ngon-ngu-tu-nhien/index.html https://medium.com/greyatom/an-introduction-to-bag-of-words-in-nlp-ac967d43b428 (bài viết bằng tiếng Anh)

Thuật toán phân loại SVM: https://viblo.asia/p/ung-dung-support-vector-machine-trong-bai-toan-phan-loai-hoa-PdbGnLXBkyA

Naive Bayes / Bag os words vào bài toán phân loại thư rác: https://viblo.asia/p/ly-thuyet-ve-mang-bayes-va-ung-dung-vao-bai-toan-loc-thu-rac-07LKXzkelV4

Github của mình về bài tương tự: https://github.com/hoanganhpham1006/IT_post_classification

Về phần ads trên video, sẽ phức tạp hơn nhiều, nhưng 1 cách tổng quan, phương pháp vẫn bao gồm 2 bước: trích xuất đặc trưng (vector hóa) và phân loại. Bạn có thể tìm hiểu kỹ hơn về vấn đề trích xuất đặc trưng video.

Chúc bạn thành công

Chia sẻ
Avatar Anh Tuấn Hoàng @kstn_hut_hat
Nov 26th, 2018 3:28 a.m.

Cảm ơn câu trả lời của bạn. Rất nhiệt tình. Mình thấy text thì ok còn video thì đúng là hơi khó nhằn.

Viblo
Hãy đăng ký một tài khoản Viblo để nhận được nhiều bài viết thú vị hơn.
Đăng kí