Phạm Văn Toàn @pham.van.toan

23.9K 1.4K 93

Đã đăng vào thg 2 21, 2023 3:50 SA

trong

24 phút đọc

5.6K

ChatGPT hay là "Chết GPT"?

Editors' Choice ContentCreator

Cảnh báo

Bài viết này chỉ là quan điểm cá nhân của mình về ChatGPT - một ứng dụng AI sốt sình sịch trong thời gian gần đây. Tuy nhiên, bài viết này sẽ có cả những luận điểm không vừa tai về nó. Chống chỉ định với các Fan cuồng ChatGPT hay hội các nhà tư tưởng đang mơ mộng về một tương lai AI có thể thay thế con người.

Cha đẻ của ChatGPT là ai?

Có lẽ trong những ngày gần đây ChatGPT là một cụm từ hot hơn bất kì vấn đề công nghệ nào được công bố từ trước đến nay. Chỉ cần nhìn vào biểu đồ thời gian cần để đạt được mức 100 triệu người dùng thì đủ thấy sức hút của nó lớn đến mức như thế nào. Nó đã vượt qua cả ứng dụng giải trí hàng đầu thế giới hiện nay là Tiktok để vươn lên vị trí dẫn đầu trong danh sách các ứng dụng công nghệ đạt 100 triệu người dùng chỉ sau 2 tháng phát hành.

Thành công của ChatGPT khiến người ta tò mò về cha đẻ của nó - OpenAI - một công ty khởi nghiệp trong lĩnh vực trí tuệ nhân tạo được tạo ra năm 2015 với sứ mệnh ngăn chặn sự không an toàn, nguy hiểm của công nghệ AI. Một trong những điểm đáng chú ý là công ty này được co-found bởi một trong những nhân vật đình đám và cũng không kém phần tai tiếng trong giới công nghệ - tỷ phú Elon Musk. Dù hiện nay vị tỷ phú này đã tuyên bố không còn nắm giữ cổ phần ở OpenAI nữa. Tuy nhiên sức ảnh hưởng của vị chủ tai tiếng này thì vẫn luôn còn mãi. Lát nữa mình sẽ có những phân tích chi tiết hơn ở các phần sau.

Có thể nói từ khi thành lập năm 2015 cho đến hết năm 2017, OpenAI không có tiếng tăm gì trong giới công nghệ cả. Lúc đó là thời điểm các mô hình mạng nơ ron dựa trên CNN đang lên ngôi và ứng dụng phổ biến nhất của nó tất nhiên nhiều nhất chính là Computer Vision. Thời điểm đó người ta chưa thực sự chú ý quá nhiều đến AI. Các framework cũng còn rất non trẻ khi mới chỉ có Tensorflow 1 và PyTorch thì còn chưa xuất hiện cho đến tận tháng 9/2016. Xét về khía cạnh nghiên cứu học thuật thì OpenAI càng không có cửa so với các lab nghiên cứu lớn thời đó như Google Brain hay Facebook AI chẳng hạn.

Nhưng năm 2017 thực sự là một dấu mốc quan trọng và nó là khởi nguồn cho tất cả câu chuyện về sau... Này, bạn vẫn còn đọc đó chứ, chúng ta cùng đi tiếp nhé. Sắp có chuyện hay rồi.

ChatGPT có cái gì đột phá?

Tại sao bên trên mình lại nhắc đến cột mốc 2017. Cũng nhắc lại một chút về các thời điểm trước đó, khi mà ứng dụng về NLP chưa được đa số các công ty để mắt đến ngoại trừ một số lab nghiên cứu lớn. Một phần bởi các phần cứng thời đó chưa khả thi với lượng dữ liệu rất lớn, một phần vì các kiến trúc và mô hình mạng nơ ron trước kia chưa thực sự đủ sức mạnh để mô hình hóa loại dữ liệu với rất nhiều ràng buộc ẩn về ngữ nghĩa, ngữ cảnh như ngôn ngữ tự nhiên. Tuy nhiên cột mốc 2017 thực sự đáng nhớ đối với những người làm trong lĩnh vực AI nói chung và trong xử lý ngôn ngữ tự nhiên nói riêng, khi mà một kiến trúc mạng nơ ron thần thánh mới ra đời mang tên Transformer. Kiến trúc này được một phòng nghiên cứu của Google là Google Brain phát minh và sau đó công bố cho toàn thế giới được kế thừa và sử dụng nó. Kể từ đó, kiến trúc Transformer đã thực sự làm mưa làm gió trên khắp các lĩnh vực như xử lý ngôn ngữ tự nhiên, xử lý tiếng nói, xử lý hình ảnh... Ưu điểm lớn nhất của Transformer là có thể cho phép mô hình AI học tập dựa trên lượng dữ liệu khổng lồ mà không cần gán nhãn thủ công các câu hỏi - câu trả lời như trước nữa. Bản thân Transformer cùng cách huấn luyện của nó giúp cho mô hình tự hiểu được các đặc trưng tiềm ẩn bên trong dữ liệu thay vì chỉ ghi nhớ nó một cách máy móc và thụ động. Điều đó tức là kể từ thời điểm Transformer ra đời thì việc huấn luyện các mô hình ngôn ngữ đơn giản hơn rất nhiều, chúng ta chỉ cần đẩy thật nhiều, thật nhiều chữ vào trong mô hình để nó có thể tự tìm ra các đặc trưng của dữ liệu mà thôi.

Quay trở lại với OpenAI, phải nói rằng họ là một công ty phát triển ứng dụng hơn là nghiên cứu. Họ ứng dụng rất nhanh các thành tựu của Transformer và nhanh chóng cho ra đời các loại mô hình sinh như các bạn thấy trên hình phía trên. Các họ mô hình này mang tên là GPT - Generative pre-trained transformer. Ngay sau khi Transformer ra đời năm 2017, tháng 1 năm 2018 -so fast and furious thì OpenAI cho ra đời mô hình GPT-1 đầu tiên phục vụ cho việc sinh ngôn ngữ . Kiến trúc của GPT kế thừa rất nhiều từ mô hình Transformer gốc và nó đã trải qua các phiên bản từ GPT-1, GPT-2, GPT-3 rồi đến giờ là ChatGPT. Mỗi một lần cải tiến, mô hình này như đứa trẻ càng ngày càng học được nhiều kiến thức hơn, đi kèm với đó là cơ thể cũng cao to, béo tốt hơn. Điều đó minh chứng ở số lượng tham số của các mô hình này tăng lên một cách chóng mặt. Các bạn có thể xem nó trong biểu đồ dưới đây.

Việc OpenAI có gì đột phá trong việc phát triển các mô hình sinh ngôn ngữ của họ, bản thân mình nghĩ là không. Họ được hưởng lợi từ phát minh của Google. Kế thừa và phát triển là điều thường thấy trong giới khoa học, điều đó cũng không có gì là xấu cả. Nhưng cái cách mà họ tiếp cận với các mô hình ngôn ngữ này thực sự khiến người ta quan ngại. Tại sao mình lại nói như thế, thì mời bạn đọc chúng ta cùng nhau phân tích tiếp nhé.

Tại sao đến bây giờ mới công bố?

Dù có rất nhiều ưu điểm như vậy nhưng các mô hình ngôn ngữ vẫn có một nhược điểm vô cùng lớn mà chưa một nhà khoa học hay một công ty nào có thể giải quyết được đó chính là tính đúng/sai của câu trả lời. Tức là các mô hình sinh ngôn ngữ có thể tạo ra các nội dung sai hoàn toàn theo quan điểm đạo đức của con người. Và đúng ra thì các mô hình GPT của OpenAI cũng sẽ chung một số phận với rát nhiều các mô hình AI sinh ngôn ngữ được ra đời sau 2017. Nhan nhản trên internet các bạn có thể đọc được các tin như Chatbot của Facebook bị khai tử vì tự chat với nhau bằng ngôn ngữ mới hay Chatbot của Microsoft phân biệt chủng tộc. Đó chính là lý do vì sao các Chatbot của các công ty công nghệ lớn lại sớm nở chóng tàn như thế.

Quay trở lại với OpenAI, các mô hình GPT-1 và GPT-2 là các mô hình Open Source nhưng với tấm thân nhỏ bé của mình chưa thực sự đưa ra được nhiều tiếng vang. Những câu trả lời đưa ra của GPT-1 và GPT-2 đôi khi rất ngô nghê, buồn cười nhưng là các mô hình Open Source và đổi khi được phục vụ với mục đích giải trí nên cũng chẳng ai quan trọng tính đúng sai của nó. OpenAI vẫn tiếp tục tăng số lượng tham số và huấn luyện thật nhiều hơn cho các mô hình GPT của họ và cho đến phiên bản GPT-3 được ra đời năm 2020 thì họ đi theo hướng close source.

Dù tất cả các nhược điểm trên một chatbbot của GPT-3 vẫn còn tuy nhiên họ vẫn bất chấp để phát hành bản thương mại của GPT-3 dưới dạng một API sinh văn bản. Mình phải dùng từ bất chấp bởi họ thừa biết rằng GPT-3 vẫn còn rất nhiều nhược điểm, vi phạm các quy chuẩn đạo đức của ngành. Họ bất chấp kiếm tiền trên một thứ mà không kiểm soát được thông tin sinh ra. Điều này thật là đáng sợ.

Khi GPT-3 ra mắt, cũng đã bắt đầu có nhiều dư luận hướng về nó như một ứng dụng AI thực sự thông minh và toàn năng. Đang lúc giữa làn song tung hô đang lên cao thì cơn bão COVID-19 ập tới cuốn bay tất cả. Cuốn cả những ước mơ về một Trí tuệ nhân tạo toàn năng của GPT-3 và OpenAI ra đảo xa.

Nếu không có COVID-19 thì có lẽ chúng ta đã được trải nghiệm ChatGPT từ 3 năm trước rồi.

ChatGPT-3 - bình mới rượu cũ?

Sau khi làn sóng COVID-19 đã qua và mọi thứ trở lại trạng thái bình thường mới, thì cũng là lúc OpenAI trở lại với tham vọng của mình và một lần nữa họ lại bất chấp tất cả. Nhưng lần này, họ thực sự rất thông minh khi cho ra đời một phiên bản Facelift của GPT-3 nhưng kết hợp thêm với các kĩ thuật engineering trong làm chatbot để tạo ra một thứ mới gọi là ChatGPT và thật bất ngờ, chính cách tiếp cận theo kiểu hội thoại và giao diện thân thiện giúp cho ChatGPT dễ dàng tiếp cận với số đông người dùng. Chính vì thế nên ChatGPT trở nên vô cùng phổ biến. Nhưng thực ra nó chỉ là một dạng bình mới rượu cũ mà thôi. Đến thời điểm này mình lại thực sự thấy OpenAI đang có vẻ như không làm đúng như tôn chỉ ngăn chặn sự nguy hiểm của AI từ trong trứng nước như chính họ đặt ra khi bất chấp phát hành những sản phẩm dưới tiêu chuẩn đạo đức của ngành. Phải chăng họ cũng bị ảnh hưởng bởi một nhân vật nào đó họ nhà lươn.

Những nhược điểm chết người của ChatGPT

Nhiều người sẽ nghĩ mình viết bài viết nay để câu view hay sẽ có những ý kiến nói rằng ông có làm được không mà nói. Mình xin phép không quan tâm đến điều đó. Thứ mình muốn chia sẻ ở đây là những góc nhìn đúng đắn hơn từ một người làm kĩ thuật và làm trong mảng trí tuệ nhân tạo. ChatGPT là một mô hình ngôn ngữ lớn, điều đó không thể chối cãi, và bản thân nó tồn tại những nhược điểm cố hữu sau:

Lấy thịt đè người

Chưa có con số chính thức về số lượng tham số của ChatGPT tuy nhiên với việc kế thừa từ GPT-3 với 175 tỉ tham số thì mô hình này cũng thuộc dạng siêu to khổng lồ rồi. Vào năm 2020, GPT-3 là mô hình ngôn ngữ lớn nhất từng được đào tạo, với 175 tỷ tham số. Nó lớn đến mức cần 800 GB bộ nhớ để huấn luyện nó. Năm nay, nó đã bị BLOOM (BigScience Large Open-science Open-access Multilingual Language Model) soán ngôi vị trí đầu bảng trong số các mô hình lớn nhất) với 176 tỷ tham số. Đây thực sự là một cuộc đua về phần cứng khi mà phải cần đến 40 GPUs loại 24GB chỉ để chứa mô hình. Chưa kể rằng với lượng dữ liệu training khổng lồ thì các mô hình ngôn ngữ như GPT-3 đòi hỏi lượng chi phí tính toán và phần cứng khổng lồ. Mình đang không hiểu đến mô hình GPT-4 họ dược dự định có để MỘT TRĂM NGHÌN TỈ tham số tức gấp 571 lần mô hình hiện tại thì mức độ khủng khiếp của dàn tính toán sẽ ra sao. Đây thực sự là một công việc lấy thịt đè người mà bất kì các công ty công nghệ non trẻ nào cũng không có cửa trong cuộc đua này.

Dữ liệu không "sạch"

Chắn chắn rằng OpenAI sẽ chẳng thể nào đủ thời gian để dùng con người đọc và kiểm chứng hết tất cả các dữ liệu đưa vào mô hình ngôn ngữ bởi điều đó là không thể. Nó cũng đi ngược lại tiêu chí phát triển các mô hình bằng việc tự tìm ra các đặc trưng ẩn từ dữ liệu không cần gán nhãn của các mô hình ngôn ngữ như GPT. Chính vì thế, khi chúng ta sử dụng ChatGPT cần phải chấp nhận rằng chúng ta đang nói chuyện với một chiếc máy đào tạo từ một đống dữ liệu hỗn tạp và không có gì kiểm chứng được tính đúng đắn của nó cả. Và bạn cũng đừng quên một nguyên lý kinh điển trong khoa học máy tính Garbage in, garbage out - đừng kì vọng một kết quả đầu ra tốt với đầu vào là một đống rác rưởi.

Chém gió thành thần

Lại trở về câu chuyện của đúng và sai, vốn dĩ nó là một phạm trù rất khó phân biệt ngay cả đối với con người bình thường. Và chắc hẳn hơn một lần các bạn sẽ nhận được các câu trả lời của ChatGPT hết sức tự nhiên nhưng lại hoàn toàn không có thật. Đây có lẽ là điểm yếu lớn nhất của một mô hình ngôn ngữ bởi nếu như thông tin đưa ra không có thật mà lại tự nhiên đến mức làm cho người ta tin rằng nó có thật thì thật là nguy hiểm biết chừng nào.

Cập nhật rất chậm

Như đã nói ở trên, việc huấn luyện các mô hình ngôn ngữ như ChatGPT là vô cùng tốn kém nên đó là lý do tại sao nó không thể đáp ứng được với các thông tin dạng thời sự bởi đơn giản dữ liệu của nó đã là các dữ liệu trong quá khứ và không còn mới nữa. Có lẽ phải đến khi có công nghệ tính toán siêu việt gấp hàng tỉ lần bây giờ như công nghệ lượng tử thì mới có thể giúp các mô hình ngôn ngữ như thế này trở nên real-time update.

Thay thế các search engine như Google - còn xa lắm

Như đã nói ở trên rồi, không phải các ông lớn họ ngu ngốc đến mức để một startup non trẻ như OpenAI vượt mặt đâu các bạn. Họ có nguồn tài nguyên lớn, nguồn dữ liệu lớn thì chẳng lý do gì họ lại không nghĩ đến việc phát triển ra các thứ như ChatGPT mà OpenAI đang làm ra cả. Chỉ là họ hiểu các đứa con do chính mình làm ra vẫn còn cần phải được dạy dỗ tử tế hơn trước khi đưa nó ra ngoài đường để nó thích nói gì thì nói thì nhỡ đầu người ta tìm về tận nhà chửi cha chửi mẹ nó lên thì làm sao.

Bản thân việc trả ra một câu trả lời duy nhất như ChatGPT đang làm khiến cho thông tin hoàn toàn bị một chiều và không đa dạng và không cho chúng ta quyền lựa chọn và tìm hiểu. Chính kĩ năng tìm kiếm và đào sâu trên các kết quả cho chúng ta những trải nghiệm, những kinh nghiệm chứ không phải là việc hỏi và đáp với một Chatbot mà chính những câu trả lời chúng ta cũng không biết được nó đúng hay sai. Rồi cuối cùng chúng ta lại phải tự đi tìm kiếm và kiểm chứng lại thông tin thôi.

Là mục tiêu về công nghệ hay về tài chính?

Bản thân mình nghĩ OpenAI là một công ty khởi nghiệp công nghệ nên mục tiêu của họ vẫn là doanh thu và lợi nhuận. Họ khác với các phòng thí nghiệm nghiên cứu khoa học của các tập đoàn lớn khác khi mà các lab khác có nguồn ngân sách riêng để chỉ cần tập trung phát triển những công nghệ mới. Chính bởi những mục tiêu về tài chính của họ nên họ mới bất chấp đưa ra các sản phẩm mà dưới mức tiêu chuẩn ngành. Tuy nhiên đây thực sự là một nước đi thành công của họ. Chúng ta có thể thấy được các động thái về tài chính tích cực như:

Rất nhiều doanh nghiệp lớn đầu tư và OpenAI và các công ty AI khác
Rất nhiều cổ phiếu của các công ty làm về AI bay tới nóc
Ngay cả những doanh nghiệp nhỏ làm AI như bọn mình cũng được hưởng lợi vì khách hàng biết đến nhiều hơn và lượng dự án cũng trở nên nhiều hơn

Đối với cá nhân một người làm AI như mình thì đó là một tín hiệu tích cực.

Nhưng chắc chắn với nền tảng phát triển và triển khai quá cồng kềnh thì có lẽ ChatGPT phải cần cái tiến rất rất nhiều nữa mới đủ đến mức tạo được lợi nhuận lớn như OpenAI mong đợi. Về phía các nhà đầu tư chắc hẳn họ cũng có những nhận định riêng của mình về công nghệ này hơn là FOMO một cách thái quá như hiện nay.

Dưới góc nhìn của một người làm về công nghệ, mình xin được chia sẻ một khái niệm gọi là Hype Cycle. Theo đó, Công nghệ đột phá nào cũng phải bò qua đường cong này, kể cả ChatGPT:

Đầu tiên là thời kì ra đời
Sau đó là thời kì bị thổi phồng
Sau đó là đến thời kì vỡ mộng, giác ngộ, phát triển, bền vững
Và cuối cùng là đi vào đời sống.

Có thể thấy các ứng dụng như Computer Vision đã gần hoàn thiện và đi vào thực tế đời sống

Vạy còn ChatGPT của chúng ta thì sao. Đương nhiên nó cũng sẽ phải trải qua những thời kì như thế. Sau đây là bức tranh về viễn cảnh tương lai của ChatGPT

ChatGPT hay là "Chết GPT"?

Hãy tưởng tượng thế giới sẽ ra sao nếu như tất cả các thông tin trên internet đều được tạo ra bởi một tay ChatGPT. Chúng ta sẽ không còn có thể phân biệt được đâu là đúng, đâu là sai và chính lúc đó nó sẽ nhấn chìm chúng ta trong biển thông tin sai lệch mà nó tạo ra. Là một người yêu công nghệ, mình thực sự khuyên các bạn hãy có cái nhìn tỉnh táo và tận dụng ChatGPT một cách hợp lý nhất. Hơn nữa, luôn có sự nghi ngờ và double check với những câu trả lời từ nó.

Đừng để ChatGPT trở thành "Chết GPT" của mỗi chúng ta.

gpt