Machine learning và những ứng dụng vi diệu

Bài đăng này đã không được cập nhật trong 7 năm

Machine learning là gì ?

Machine learning, một lĩnh vực của Trí tuệ nhân tạo (AI) giúp máy tính có khả năng tự học dựa trên dữ liệu để giải quyết vấn đề mà không cần phải được lập trình thật chi tiết, cụ thể. Để đơn giản, hình dung bạn cần phân biệt quả táo và quả cam. Thật dễ dàng, tích tắc bạn có thể đưa ra đáp án nhưng với máy tính thì khác, làm sao máy tính có thể hiểu được đâu là quả táo, đâu là quả cam. Một cách làm là bạn sẽ lập trình đưa vào máy tính các hướng dẫn chi tiết về màu sắc, hình dạng, bề mặt vỏ, … để máy tính thực hiện nhưng làm sao bạn có thể đưa được đủ chỉ dẫn cho rất rất nhiều trường hợp??? Có một cách khác nữa là chúng ta sẽ chỉ cho máy tính cách học để hiểu và tự phân biệt được và đó chính là machine learning.

Machine learning và những ứng dụng vi diệu

Nghe có vẻ xa vời nhưng thật ra hiện nay lĩnh vực này đang rất phát triển và có nhiều kết quả ấn tượng. Hãy cùng chúng tôi tham khảo những ứng dụng sau của machine learning để có thể hình dung được ứng dụng machine learning thật sự vi diệu thế nào, có ảnh hưởng đến tương lai ra sao, có khi nào tiên đoán của nhà vật lý thiên tài Stephen Hawking về tác động của của trí tuệ nhân tạo sẽ đến sớm hơn dự đoán ??? Hô biến ảnh trắng đen thành ảnh màu

Deep learning giúp máy tính có thể tô màu tự động các bức ảnh

Chúng ta có thể dễ dàng chuyển ảnh màu thành thành ảnh đen trắng, nhưng đổi ngược lại thì hoàn toàn là một câu chuyện khác. Thế nhưng với kỹ thuật Deep learning, hình ảnh sẽ được tô màu một cách tự động dựa trên việc phân tích và hiểu được bối cảnh, các đối tượng trong bức ảnh để tự chọn màu sắc phù hợp cho các đối tượng trong bức ảnh. Nhóm nghiên cứu tại Đại học UC Berkeley dưới sự dẫn dắt của trưởng nhóm Richard Zhang đã thực hiện “huấn luyện” cho hệ thống trên dữ liệu hàng triệu bức ảnh với nhiều lớp xử lý để cho ra kết quả y như thật. Bạn có thể tham khảo thêm chi tiết về công trình của nhóm, các kết quả đạt được và cả source code tại http://richzhang.github.io/colorization/. Nhóm cũng đã thương mại hóa các sản phẩm nghiên cứu của mình và đưa ra nhiều mức phí dành cho kỹ sư, nhà khoa học dữ liệu và doanh nghiệp để khai thác các thư viện API liên quan đến machine learning tại địa chỉ https://demos.algorithmia.com/colorize-photos/ Đặc biệt, bài toán tô màu ảnh đã được hãng phần mềm xử lý hình ảnh Photoshop giới thiệu với tên gọi là Scribbler tại Hội nghị Adobe MAX 2017 với độ chính xác rất ấn tượng cho cả hình chụp, hình vẽ. Dự kiến hãng sẽ đưa Scribbler vào sản phẩm hoặc tính năng trong thời gian tới. Adobe giới thiệu Scribbler cho phép “hô biến” ảnh trắng đen thành ảnh màu

Tự động tạo chú thích cho bức ảnh

Machine learning có thể tự tạo ra các chú thích, nội dung mô tả cho hình ảnh mà bạn đưa vào. Bài toán này đòi hỏi đầu tiên máy tính phải hiểu được các đối tượng chính trong bức ảnh rồi sau đó diễn đạt lại bằng nội dung sao cho có nghĩa và đúng ngữ pháp. Đó là sự kết hợp giữa thị giác máy tính và xử lý ngôn ngữ tự nhiên, một bài toán không dễ trong lĩnh vực trí tuệ nhân tạo. Để làm được điều đó hệ thống sẽ sử dụng số lượng lớn mạng nơ-ron tích chập (convolutional neural network) cho phần nhận dạng đối tượng trong bức ảnh, rồi sau đó là sử dụng mạng nơ-ron hồi quy (recurrent neural network) để chuyển các nhãn thành câu có nghĩa, tương ứng với bức ảnh. Từ năm 2014, đã có rất nhiều nghiên cứu, thuật toán liên quan đến lĩnh vực này với những kết quả ngày càng chính xác, ấn tượng. Tin vui là lời giải cho bài toán này hiện đang có trong bộ API Vision của Microsoft Cognitive Service API với tính năng cho phép bạn nhận diện hình ảnh, các đối tượng trong ảnh, khuôn mặt và cả cảm xúc,…. với độ chính xác không ngờ. Bạn có thể đăng ký để trải nghiệm miễn phí với hạn mức là 5000 yêu cầu trong mỗi tháng, thật quá đủ để bạn có thể bắt đầu trải nghiệm với machine learning. API Vision của Microsoft Cognitive Service API cho phép nhận diện thông tin trong bức ảnh

Dịch máy

Giờ đây bạn không những có thể dịch văn bản mà bạn còn có thể dịch được hình ảnh từ ngôn ngữ này sang ngôn ngữ khác. Nếu dịch văn bản giữa hai ngôn ngữ chỉ cần sử dụng Recurrent Neural Network thì dịch hình ảnh hệ thống cần sử dụng thêm Convolution Neural Network để có thể nhận diện được các từ xuất hiện trong ảnh chụp.
Dịch máy đang là thị trường khá lớn với nhiều tên tuổi như Amazon, Google Cloud, Baidu, IBM Watson,… Hầu hết các hãng này đều cho phép người dùng đăng ký sử dụng API trong xử lý ngôn ngữ tự nhiên vào ứng dụng của mình với mức phí được tính theo lượng sử dụng, và rất thấp nếu bạn muốn thử. Bạn có thể đăng ký thử sử dụng thử miễn phí các thư viện API để xử lý ngôn ngữ tự nhiên của Microsoft và Google tại link sau:

Microsoft: https://azure.microsoft.com/en-us/services/cognitive-services/directory/lang/
Google Cloud: https://cloud.google.com/translate/

Viết truyện – làm thơ – viết quảng cáo …

Tháng 12 năm 2017, fan hâm mộ Harry Porter không khỏi ngạc nhiên trước thông tin Harry Porter có chương mới, nhưng niềm vui đó không trọn vẹn vì sản phẩm không phải do nhà văn phù thủy JK Rowling chấp bút mà được xây dựng bằng trí tuệ nhân tạo (AI – Artificial Intelligence). Bằng cách sử dụng tính năng tiên đoán, Botnik Studios đã cho AI đọc toàn bộ 7 phần Harry Potter rồi sau đó AI sẽ tự động phân tích từ ngữ, câu văn và ngữ pháp để soạn ra những đoạn văn hoàn toàn ngẫu nhiên mà khi đọc lên, người đọc vẫn nhận ra có gì đó “giống giống” phong cách của nữ văn sỹ J.K.Rowling. Tuy còn nhiều sai sót về cốt truyện và cấu trúc hành văn chưa được ổn lắm, nhưng cấu trúc ngữ pháp hầu như rất chính xác - đây được coi là bước tiến lớn và nhiều tiềm năng đối với công nghệ AI trong lĩnh vực sáng tác. Thật vậy, đến tháng 04 năm 2018, Bonik đã dùng AI xây dựng nên câu chuyện mang tên “Nàng công chúa và con cáo” mang đầy đủ các yếu tố đặc trưng của cổ tích như: một nàng công chúa xinh đẹp bị vua cha ép làm đám cưới, chàng trai nghèo con của người thợ xay bột, con thú biết nói, cùng vương quốc chỉ toàn “bánh mì và phô mai”. Họ đã sử dụng một chương trình AI để “học” những câu chuyện cổ tích của anh em nhà Grimm, rồi đưa ra gợi ý cho các từ và cụm từ theo luồng mạch tương tự. Sau đó, ê-kíp biên tập của Botnik thêm vào các chi tiết, sắp xếp các ý tưởng có được từ thuật toán AI thành một câu chuyện hoàn chỉnh. CALM, ứng dụng thư giãn tâm trí đã đặt mua sản phẩm này và đưa vào tuyển tập những câu chuyện của ứng dụng với cái tên "Chuyện cổ Grimm bị thất lạc". Hãy cùng tham khảo một đoạn ngắn trong truyện AI này bạn nhé: Còn làm thơ thì sao ? Vừa qua, nhóm kỹ sư của Brooklyn đã sử dụng AI để kết hợp trái tim của đại thi hào Shakespeare với khả năng của AI để tạo ra ứng dụng cho phép người dùng nhanh chóng có được những bài thơ gửi người thương mang phong cách của Shakespeare. Nhóm đã sử dụng dữ liệu từ 154 bài thơ của Shakespeare áp dụng vào xích Markov, mô hình xử lý ngôn ngữ tự nhiên và thuật toán để đoán xem từ nào sẽ xuất hiện kế tiếp để tạo nên những bài thơ đọc lên nghe “có vẻ” Shakespeare. Bạn có thể thử xem kết quả thế nào tại đây Không dừng lại đó, tháng 07/2018 cổng thương mại điện tử Alibaba của Trung Quốc đã tạo ra một công cụ Trí tuệ nhân tạo (AI), cho phép có thể phát sinh ra 20.000 mẫu quảng cáo mỗi giây. Người bán có thể lựa chọn các ý tưởng quảng cáo khác nhau để tạo ra quảng cáo của riêng mình thông qua công cụ cho phép “tạo ra quảng cáo thông minh theo mẫu" và như vậy họ không phải mất nhiều thời gian cho việc viết lách. Christina Lu, phụ trách bộ phận tiếp thị của Alibaba, cho biết: "Những nội dung được AI viết ra là kết quả của quá trình deep learning dựa vào khối lượng lớn những nội dung chất lượng cao do con người tạo ra trước đó. AI sẽ không thể thay thế hoàn toàn con người trong công việc vốn đòi hỏi nhiều sự sáng tạo này. Nhưng khi áp dụng trí tuệ nhân tạo cho Marketing, con người sẽ có thể dành nhiều thời gian, công sức và trí tuệ hơn cho việc sáng tạo". Rất rất nhiều ứng dụng của trí tuệ nhân tạo đang dần bước vào cuộc sống chúng ta, để kết thúc phần này chúng tôi gửi đến bạn ứng dụng AutoDraw của Google, trợ thủ đắc lực trong việc giúp bạn vẽ minh họa.
AutoDraw sử dụng trí thông minh nhân tạo (AI) để phân tích các nét vẽ nguệch ngoạc của bạn và biến chúng thành những sản phẩm hoàn chỉnh trong nháy mắt. Với khả năng có thể đoán được ý nghĩ của bạn và AI sẽ biến thành những hình ảnh giống với những gì bạn nghĩ. Đó là một bước tiến của AI và là kết quả từ các tính toán tốc độ cao trên kho dữ liệu học khổng lồ của Google. Và rất rất nhiều ứng dụng khác của trí tuệ nhân tạo, của machine learning trong nhiều lĩnh vực đang dần thành hiện thực như: xe không người lái, robot phẫu thuật, điều khiển bằng giọng nói, chuẩn đoán y khoa, dự đoán thị trường, tự động hóa, nông nghiệp thông minh, … Machine learning – Một phần không thể thiếu trong Cách mạng công nghiệp 4.0.