Thảo luận

đã bình luận cho bài viết

Xây dựng một phần mềm kiểm tra đạo văn như thế nào? của

thg 3 4, 2024 12:50 CH

thuật toán bên mình tự phát triển riêng, sử dụng kết hợp giữa n-gram + invert index + thuật toán tự xây cho đối chiếu 2 đoạn text, nó hơi phức tạp với lại là bí thuật của công ty nên xin phép không chi tiết hơn. Trước đây data ở kích thước nhỏ thì bên mình có dùng Lucene (có customize) kết hợp với Word Embedding để tính toán, nhưng dữ liệu khi lên lớn hơn 10 triệu urls thì phải tinh chỉnh và tự viết, không dùng công nghệ có sẵn được (muốn dùng thì phải đốt tiền nâng server). Vì các công nghệ full-text search có sẵn phù hợp với search engine truyền thống: hợp với search keyword ngắn, cachable; còn kiểm tra đạo văn thì toàn tìm câu văn dài.

Marcus Do

đã bình luận cho bài viết

Pretrain Model Vision Transformer in Pytorch của

Đạt Nguyễn

thg 3 4, 2024 10:15 SA

GÚT CHÓP bro

Nguyen Phi Khanh

đã bình luận cho bài viết

Dockerize ứng dụng Laravel của

Mai Trung Đức

thg 3 4, 2024 10:02 SA

@Plumpboy cảm ơn bác, đó giờ em vẫn thắc mắc sao composer install lúc build xong không thấy vendor đâu

Phạm Tiến Đạt

đã bình luận cho bài viết

Khác nhau giữa abstract class và interface khi nào dùng chúng của

tiepnet

thg 3 4, 2024 9:56 SA

@chuyenbka giờ mới đọc được cái cmt này,rất hữu ích ạ, cảm ơn 2 anh đã khai sáng thêm

Anh Dang

đã bình luận cho bài viết

Xây dựng một phần mềm kiểm tra đạo văn như thế nào? của

Nguyễn Ngọc Sơn

thg 3 4, 2024 9:13 SA

Ở phần check trùng bạn sử dụng thuật toán gì để kiểm tra vậy ạ

Vu Anh

đã bình luận cho bài viết

Trải nghiệm phỏng vấn Software Engineer của mình tại TikTok Singapore của

Mai Trung Đức

thg 3 4, 2024 9:02 SA

HI Bác, tò mò về các câu hỏi xoay quanh vấn đề management, bác ôn ở đâu vậy ạ.

Mai Trung Đức

đã bình luận cho bài viết

Trải nghiệm phỏng vấn Software Engineer của mình tại TikTok Singapore của

Mai Trung Đức

thg 3 4, 2024 3:56 SA

@dunguyen01 a ko biết nữa, nhưng cứ thử thôi e ạ

xuanthang phan

đã bình luận cho bài viết

Memory layout của một chương trình C/C++ của

Nguyen Van Thuan

thg 3 4, 2024 3:53 SA

quá hay, đang tìm mãi cái này, cảm ơn tác giả

Tran Minh Nhat

đã bình luận cho bài viết

Đã sinh ra QR Login, sao còn sinh ra QRLJacking 🙉 của

Tran Minh Nhat

thg 3 4, 2024 2:26 SA

Hmmmm, có thể gọi kỹ thuật đấy là QR overlay/replace attack 🤔

Du Code Lởm

đã bình luận cho bài viết

Trải nghiệm phỏng vấn Software Engineer của mình tại TikTok Singapore của

Mai Trung Đức

thg 3 4, 2024 2:19 SA

@maitrungduc1410 e mới có bằng cao đẳng không có bằng đại học ko biết có đc không ạ .

Hiếu Phan Ngọc

đã bình luận cho bài viết

Kỹ thuật tấn công XSS và cách ngăn chặn của

Phuong Duong Thi

thg 3 3, 2024 6:45 CH

Trần Khải

đã bình luận cho bài viết

Fine-tuning một cách hiệu quả và thân thiện với phần cứng: Adapters và LoRA của

Nguyen Mai

thg 3 3, 2024 12:02 CH

Đọc xong bài viết này mình đăng ký ngay tài khoản để comment. Mình coi một đống video trên youtube mà cũng ko hiểu gì về LoRA hết thế mà đọc xong bài của tác giả cái hiểu ngay luôn. Cảm ơn tác giả nhiều !

Nhi Nguyễn

đã bình luận cho bài viết

Tạo modal với Nextjs 14 của

huyi

thg 3 3, 2024 8:41 SA

Bài viết hay quá 🫢🫢

Nhi Nguyễn

đã bình luận cho bài viết

Calendar với Reactjs Typescript sử dụng Moment của

huyi

thg 3 3, 2024 8:39 SA

Hay quá anh oiiii. Hóng phần tiếp theooo🫠🫠

Vu Tong

đã bình luận cho bài viết

Nguyên Lý SOLID: Bí Quyết Viết Code Hiệu Quả Trong React và React Native của

NGUYỄN ANH TUẤN

thg 3 3, 2024 8:14 SA

SOLID tạo ra cho các ngôn ngữ OOP và backend là chủ yếu. Cố gắng áp vào frontend thì chỉ làm sai lệch ý nghĩa đi thôi (rõ nhất là phần I với D).

Thanh Tuấn

đã bình luận cho bài viết

[YOLO series] p2. Build YOLO from scratch của

Trung Thành Nguyễn

thg 3 3, 2024 6:06 SA

Em chào anh, thì e có thắc mắc là hàm boxes to tensor anh chuyển từ x,y của top_left sang center_x, center_y, rồi hàm target tensor to boxes anh lại chuyển nó về top_left đúng không ạ?

Nam Pham

đã bình luận cho bài viết

Sử dụng Elasticsearch hỗ trợ tìm kiếm trên Viblo của

Viblo Engineering

thg 3 3, 2024 5:31 SA

Cảm ơn tác giả. Hiện tại mình cũng đang được giao task tìm hiểu ElasticSearch để đưa vào hệ thống. Yêu cầu của hệ thống cũng khá giống với Viblo. Mình đang gặp khó khăn trong việc tổ chức index. Hệ thống hiện tại thì dùng SQL Server để lưu data và ElasticSearch để search. Mình đang phân vân giữa 2 giải pháp.

Mỗi table trong Sql server sẽ tạo một index tương ứng. Ví dụ như Viblo thì sẽ tạo index Bài Viết, Câu Hỏi, Tác Giả.
Tạo một index union cho tất cả các type và thêm một field type cho document.

Nếu được thì mong bạn có thể chia sẻ thêm.

Thuý Linh Nguyễn

đã bình luận cho bài viết

Học Singleton Pattern trong 5 phút. của

Doan Van Toan

thg 3 3, 2024 4:00 SA

Cam on anh nhe. Bai viet rat day du va de hieu. Ben em lam automation test voi Java, khi muon thuc thi da luong (parallel testing) cung can set-up de toi uu nhieu phan nhu the nay. Singleton pattern + ThreadLocal la du.

PTITQuyNA

đã bình luận cho bài viết

Đã sinh ra QR Login, sao còn sinh ra QRLJacking 🙉 của

Tran Minh Nhat

thg 3 3, 2024 3:55 SA

🫠🫠dán mã QR của mình đè lên QR của nhà hàng có là QRLJacking không nhỉ 🫠

Nguyễn Ngọc Sơn

đã bình luận cho bài viết

Xây dựng một phần mềm kiểm tra đạo văn như thế nào? của

Nguyễn Ngọc Sơn

thg 3 3, 2024 3:02 SA

trước kia team mình dùng Java do làm việc với Apache Lucene (lõi của Elastic Search và Solr), hỗ trợ xử lý đa luồng tốt và quen tay code Java từ trước. Tuy nhiên, nếu xử lý văn bản liên tục thì RAM + CPU lúc nào cũng full 100% và mình phải lựa chọn giữa việc tăng máy chủ (x2 tiền) hoặc cải tiến code. Qua khảo sát thì thấy nó hiệu năng cao hơn, hỗ trợ đa luồng khá tốt mà cú pháp cũng không quá phức tạp, đồng thời có vài thư viện mà mình tối thiểu cần có như RabbitMQ, API để giao tiếp với các service khác (mấy cái của C/C++ nó không có hoặc nhiều issues). Mất hơn 5 tháng để convert hết code xử lý mình cần sang Rust nhưng kết quả nó cũng đáng: hiệu năng gấp tầm 25-30 lần mà RAM chỉ dùng chưa đến 1/10 so với Java, CPU thi thoảng nhảy nhót vài giây xong là thôi.

THẢO LUẬN