Tùy vào mức độ sử dụng và đảm bảo tính sẵn sáng cho hệ thống.
Mình recommend số lượng master là 1 hoặc 3 (phải là số lẻ với master) với cấu hình thấp. Số lượng node thì có có thể 3-5 node với cấu hình trung bình.
Nếu sử dụng chạy các service có yêu cầu đặc biệt về phần cứng thì có thể tùy chỉnh cho phù hợp về cấu hình và storage của node.
Như mình trình bày ở bài viết, function calling có thể được tích hợp vào LLMs bằng fine-tunning, độ hiệu quả phụ thuộc vào độ phức tạp và kỹ năng fine-tune của người thực hiện. Theo mình biết thì việc fine-tune những mô hình mã nguồn mở có thể thực hiện function calling hiện tại một cách hiệu quả (ở cả Việt Nam cũng như trên bản đồ fine-tune của thế giới) có anh/bạn Hiếu Ngô rất giỏi, bạn có thể tham khảo các mô hình được tinh chỉnh để fc ở huggingface của anh/bạn ấy: https://huggingface.co/hiieu
Function Calling chỉ dùng được cho 1 số model siêu lớn và dùng qua API như GPT, Gemma, Claude,... có cách nào để dùng function calling cho các model open source không bác
@maitrungduc1410 dạ vâng, hiện tại app react của em dùng node làm webserver, và nó chủ yếu gọi api, api gọi vào mongodb, em sẽ monitoring xem monggodb có bị lỗi gì ở thời điểm đó không ạ. Cảm ơn anh đã chia sẻ ạ
@huyhungt2t nó còn có thể bị là do connection từ nodejs tới redis + mongo có vấn đề nữa e ạ, 1 trong 2 cái đó mà có vấn đề thì có thể nodejs cũng sẽ close luôn
a đang nghi là do redis vì a cũng từng bị vài trường hợp connection close ko lí do
@maitrungduc1410 dạ em cảm ơn anh đã phản hồi
hiện tại em đang dùng nginx ingress, và deployment
trong những lúc lỗi xuất hiện thì em kiểm tra thì lại không có log nào được bắn ra, app cũng không bị restart ạ
rresource không có gì bất thường, không vượt quá ngưỡng ( thậm trí là khá là thấp )
hiện tại em đang dùng 1 nginx làm loadbalacer trước cụm, và bên trong cụm em đang dùng nginx ingress
em cũng tăng timeout phía nginx ingress như thế này:
proxy-connect-timeout: "300"
proxy-read-timeout: "600"
proxy-send-timeout: "300"
rất mong nhận được phản hồi từ anh ạ
setup healthcheck cho app nodejs, và nếu app nodejs có vấn đề j đó (ví dụ về khả năng response) thì Docker sẽ restart luôn, đề phòng trước nginx gặp lỗi
Check docker logs, đảm bảo Docker vẫn luôn chạy, VPS (VM) server ko bị restart
update dependencies ở package.json: cái này thì a sẽ check
100 điểm về chất lượng bài viết. Đọc bài viết xong em có góc nhìn rộng hơn nhiều về hướng xử lý trong các Stage của bài toán RAG. Cảm ơn anh nhiều về bài viết chất lượng ạ
Rất mong anh ra thêm nhiều bài viết hơn về RAG ạ
Cám ơn lời nhận xét của Hiệp. Vì dự án sử dụng data của trường nên tạm thời mình không để open source được, nếu được ủng hộ mình sẽ có một bài viết cùng với repo riêng về quy trình tạo một chatbot tương tự trong thời gian tới nhé.
THẢO LUẬN
@huukimit À cái này về sau mình tự xử lý được rồi ạ. thank bác
Bài viết hay và hữu ích lắm ạ.
mọi người tham khảo các đường dẫn sau để tìm hiểu thêm về các công nghệ nha >3 https://devful-blog.vercel.app/categories/all https://tinhte.vn/thread/dto-bi-quyet-cho-ung-dung-spring-boot-hieu-qua-va-linh-hoat.3789656 https://medium.com/@21521291/the-evolution-of-web-technology-from-static-to-dynamic-and-beyond-d1981e0e6a84
Tùy vào mức độ sử dụng và đảm bảo tính sẵn sáng cho hệ thống. Mình recommend số lượng master là 1 hoặc 3 (phải là số lẻ với master) với cấu hình thấp. Số lượng node thì có có thể 3-5 node với cấu hình trung bình. Nếu sử dụng chạy các service có yêu cầu đặc biệt về phần cứng thì có thể tùy chỉnh cho phù hợp về cấu hình và storage của node.
Như mình trình bày ở bài viết, function calling có thể được tích hợp vào LLMs bằng fine-tunning, độ hiệu quả phụ thuộc vào độ phức tạp và kỹ năng fine-tune của người thực hiện. Theo mình biết thì việc fine-tune những mô hình mã nguồn mở có thể thực hiện function calling hiện tại một cách hiệu quả (ở cả Việt Nam cũng như trên bản đồ fine-tune của thế giới) có anh/bạn Hiếu Ngô rất giỏi, bạn có thể tham khảo các mô hình được tinh chỉnh để fc ở huggingface của anh/bạn ấy: https://huggingface.co/hiieu
góp ý thêm cho bạn là phần Preventive Controls nên liệt kê thêm antivirus và cả instruction prevention system (IPS) nữa
Function Calling chỉ dùng được cho 1 số model siêu lớn và dùng qua API như GPT, Gemma, Claude,... có cách nào để dùng function calling cho các model open source không bác
@maitrungduc1410 dạ vâng, hiện tại app react của em dùng node làm webserver, và nó chủ yếu gọi api, api gọi vào mongodb, em sẽ monitoring xem monggodb có bị lỗi gì ở thời điểm đó không ạ. Cảm ơn anh đã chia sẻ ạ
@huyhungt2t nó còn có thể bị là do connection từ nodejs tới redis + mongo có vấn đề nữa e ạ, 1 trong 2 cái đó mà có vấn đề thì có thể nodejs cũng sẽ close luôn
a đang nghi là do redis vì a cũng từng bị vài trường hợp connection close ko lí do
@maitrungduc1410 dạ em cảm ơn anh đã phản hồi hiện tại em đang dùng nginx ingress, và deployment trong những lúc lỗi xuất hiện thì em kiểm tra thì lại không có log nào được bắn ra, app cũng không bị restart ạ rresource không có gì bất thường, không vượt quá ngưỡng ( thậm trí là khá là thấp ) hiện tại em đang dùng 1 nginx làm loadbalacer trước cụm, và bên trong cụm em đang dùng nginx ingress em cũng tăng timeout phía nginx ingress như thế này: proxy-connect-timeout: "300" proxy-read-timeout: "600" proxy-send-timeout: "300" rất mong nhận được phản hồi từ anh ạ
@huyhungt2t vấn đề này có thể bị do:
Cách debug tìm lỗi:
@maitrungduc1410 em chào anh, em cũng hay bị lỗi thế này, mà log trong log nodejs thì lại không có log nào bắn ra ạ
100 điểm về chất lượng bài viết. Đọc bài viết xong em có góc nhìn rộng hơn nhiều về hướng xử lý trong các Stage của bài toán RAG. Cảm ơn anh nhiều về bài viết chất lượng ạ Rất mong anh ra thêm nhiều bài viết hơn về RAG ạ
Hay quá anh tôi!
Có thể setup môi trường thông qua conda nữa này https://github.com/HazyResearch/ThunderKittens/blob/main/docs/conda_setup.md
@heo001997 Thằng em 97 dạo này khoẻ không em
Cám ơn lời nhận xét của Hiệp. Vì dự án sử dụng data của trường nên tạm thời mình không để open source được, nếu được ủng hộ mình sẽ có một bài viết cùng với repo riêng về quy trình tạo một chatbot tương tự trong thời gian tới nhé.
Đỉnh ))))))))) khum gặp anh zai cả năm rồi nhưng bài ransack nãy vẫn top search Google Keep up the good work, cố lên anh zai 💪
@nguyen.chi.thanh ANH ơi cho e hỏi với ạ. câu lệnh này nghĩa là gì ạ. require 'gyousuu_const_ppcnt.pl';
em có tìm thì không thấy file này trong source code là sao ạ."gyousuu_const_ppcnt.pl"
@Truong23523 ông 96 này tiếc là chỉ học PTIT :v