[Question] Làm thế nào để luôn cập nhật kiến thức trong lĩnh vực Machine Learning?
This post hasn't been updated for 6 years
-
Việc trau dồi và cập nhật thường xuyên kiến thức là vô cùng quan trọng đối với những người làm nghiên cứu nói chung và dân làm về Machine Learning, Deep Learning nói riêng. Trong khoảng thời gian từ 2010 trở lại đây, 2 từ khóa ML và DL nhận được rất nhiều sự quan tâm từ cộng đồng, thu hút bởi những nền tảng, ứng dụng đột phá đem lại trong rất nhiều lĩnh vực khác nhau: y sinh học, xe tự hành, trợ lí ảo, hệ thống dịch ngôn ngữ, nhận diện đối tượng, ... Vậy câu hỏi đặt ra là, làm thế nào để bạn có thể bắt kịp được các xu hướng đó, khi mà công nghệ, thuật toán đang từng ngày được phát triển và cải thiện; làm thế nào để không cảm thấy bị "ngợp" trước sự phát triển liên tục của 2 chuyên ngành trên? Trong bài blog lần này, mình muốn chia sẻ các cách thức giúp mình luôn cập nhật được các kiến thức mới trong lĩnh vực Machine Learning nói chung, hi vọng sẽ có ích với các bạn. Nếu mọi người có nguồn thông tin nào khác có thể chia sẻ ngay dưới bài post nhé, cảm ơn các bạn rất nhiều! Mọi ý kiến đóng góp và phản hồi xin gửi về địa chỉ: phan.huy.hoang@framgia.com
-
Các nội dung đề cập:
- Blog
- Newsletter
- Mạng xã hội
- Youtube
- Các phương tiện khác
Blog
-
Trước một bài toán mới hay một kiến thức mới cần tìm hiểu, vấn đề đau đầu nhất là làm sao lựa chọn được nguồn tài liệu chính xác và đáng tin cậy. Giả sử bạn là một người mới tiếp xúc với Machine Learning cơ bản, bạn hỏi mình nguồn tài liệu chính thống để bắt đầu tìm hiểu thì trang web đầu tiên mình recommend sẽ là Machine Learning cơ bản và Forum ML cơ bản của tác giả Vũ Hữu Tiệp. Hay bạn bắt đầu tìm hiểu về mạng neural, mạng tích chập CNN, nguồn tài liệu mình gửi cho bạn sẽ là: CS231n. Bạn tìm hiểu về mạng RNN + LSTM, mình gửi: Colab, Karpathy và blog.echen.me , ...
-
Một số blog tiêu biểu khác:
- Machine Learning cơ bản - Tiep Vu Huu
- Medium - Toward Data Science
- Medium - InsightData
- OpenAI
- WildML
- Distill.pub
- Colah's blog
- Lilianweng's blog
- Ruder's blog
- Echen's blog
- AI Google Blog: Cảm ơn bạn Quang Phạm đã đóng góp ý kiến bên dưới
Newsletter
-
Nguồn tài liệu thứ 2 mình đề cập tới đó là các
Newsletter
hay các tin bài được gửi về đều đặn hàng tuần, hàng ngày từ các trang web bạn đãSubcribe Email
. Mình thì đăng kí khá nhiều cácNewsletter
và coi đây là nguồn tài liệu vô cùng phong phú và đa dạng, mỗiNewsletter
lại có cái hay riêng về mặt nội dung. Sau đây là 1 sốNewsletter
về Machine Learning mà mình thấy hay ho nhất- DataMachina - 1 trong những newsletter mình thích nhất
- Analytic Vidhya - mình tham khảo khá nhiều các bài hướng dẫn (tutorial) từ đây. Nhìn chung, đa phần các bài viết đều khá cẩn thận và chi tiết.
- Paper with code: gồm các paper trending trong thời gian gần đây kèm theo code (thường trên github)
- Data Elixir
- AI Weekly
- Sebastian Ruder
- Mybridge
- ...
-
Một vài newsletter liên quan khác:
- HackerNews - trang này thì nguồn thông tin khá đa dạng, không thiên về ML, chủ yếu về công nghệ, giao diện giống như reddit hồi xưa vậy Nhưng vẫn là một nguồn thông tin bổ ích, rất xứng đáng để
subcribe
- Python Weekly - có thể các bạn thắc mắc là tại sao mình lại đưa 1
Newsletter
liên quan riêng đến 1 ngôn ngữ lập trình ở đây. Nếu các bạn đã, đang làm về Machine Learning, Deep Learning thì Python là một trong những ngôn ngữ được tin dùng nhiều nhất vì sự tiện lợi và hỗ trợ khá nhiều các thư viện, được cộng đồng support rất mạnh. Khoảng thời gian từ 2 năm trở lại đây, các tin bài về Machine Learning, Deep Learning cũng xuất hiện nhiều hơn trongPython Weekly
, chiếm khoảng từ35%-45%
số lượng tin bài, chủ yếu là về các bài tìm hiểu, hướng dẫn để tạo ra một project thực tế ứng dụng Machine Learning. Ảnh minh hoạ từ mail của mình8/18
bài là về Machine Learning, Deep Learning, Data Science, ...
- HackerNews - trang này thì nguồn thông tin khá đa dạng, không thiên về ML, chủ yếu về công nghệ, giao diện giống như reddit hồi xưa vậy Nhưng vẫn là một nguồn thông tin bổ ích, rất xứng đáng để
Mạng xã hội
- Ngoài việc thu nạp các kiến thức qua các bài blog và newsletter, các mạng xã hội hay social network cũng là một cách để khiến mình luôn cập nhật được các thông tin mới nhất, ngay trong những khoảng thời gian thư giãn lướt newsfeed
-
Đứng đầu bảng xếp hạng về social network của mình chắc chắn là Twitter. Không giống như một social network thiên về giải trí như Facebook, Twitter luôn là mạng xã hội hàng đầu trong việc cập nhật tin tức. Nói không ngoa chứ phần lớn các thông tin quan trọng, nóng hổi nhất đều được đăng đàn lên twitter (và reddit) là sớm và chính xác nhất. Hơn nữa, việc cập nhật trạng thái trên twitter là khá nhanh gọn và gói gọn dưới 280 kí tự nên twitter rất phù hợp trong việc cập nhật trạng thái. Trên Twitter thì mình follow khá nhiều người, tính đến thời điểm hiện tại là khoảng gần 700 người, đa phần đều làm việc liên quan đến các lĩnh vực như: Machine Learning, Deep Learning, Data Science, AI, .. và 1 số các chuyên ngành hẹp khác. Một vài tác giả nổi tiếng trong giới ML, DL các bạn nên follow như:
- Yann Lecun: Chief Artificial Intelligence Scientist at Facebook AI Research (FAIR)
- Ian Goodfellow: Google Brain Researcher. Tác giả cuốn sách nổi tiếng trong giới Deep Learning: Deep Learning Book
- Fchollet: Deep Learning Researcher at Google. Tác giả thư viện Deep Learning Keras.
- Jakevdp: Tác giả cuốn sách được recommend rất nhiều trong giới Data Science: Python DataScience Handbook
- PyImageSearch: Computer Vision Researcher. Tác giả nổi tiếng trong giới Computer Vision. Tác giả 2 cuốn sách bestseller: Deep Learning for Computer Vision và Practical Computer Vision with Python and Opencv
- Jeremy Phoward: Founder của fast.ai, khoá MOOC về Deep Learning và thư viện mã nguồn mở nổi tiếng fastai, base trên nền Pytorch.
-
Các bạn có thể tham khảo những tác giả, nhân vật nổi tiếng trong giới ML, DL trong link sau: 50 AI Influencers to follow on Twitter
-
Hoặc mọi người có thể follow mình trên Twitter, mình tweet và retweet khá nhiều các bài post về ML, DL mà mình thấy hay và có hứng thú: __phanhoang__
Medium
- Social Network thứ 2 mình muốn nói tới là Medium, một mạng xã hội sẽ khá lạ lẫm với nhiều người, nếu so với Facebook và Twitter. Cũng tương tự Twitter, bạn follow các tác giả, tổ chức (Organizations) dựa trên lĩnh vực mà bạn quan tâm, nhưng 1 điểm mạnh mà mình muốn nói tới đó là cách thức gợi ý (recommender) bài viết tương đối tốt của Medium. Đa phần các bài được gợi ý đều thuộc lĩnh vực mình quan tâm, từ đó biết thêm khá nhiều kiến thức mới Lấy ví dụ với 1 số bài viết mình bookmark lại gần đây khi chưa có thời gian đọc:
- Social Network thứ 3 được mệnh danh là "The front page of the internet" (Trang chủ của mạng Internet). Cái hay của reddit là cái gì cũng có, hoạt động giống như 1 forum với từng subreddit (hay channel) để mọi người vào trao đổi. Subreddit mình hay ghé qua nhất là r/MachineLearning. Nhưng khá nhiều bài liên quan đến paper, nghiêng về học thuật khá nhiều nên có thể sẽ kém thu hút người đọc hơn chút.
Quora
- Về bản chất, quora khá giống với Stackoverflow, 1 mạng xã hội về hỏi đáp. Nhưng khác với SOF thiên về các câu hỏi lập trình, câu hỏi trên Quora bao quát hơn hướng đến nhiều đối tượng hơn. Nếu như các câu hỏi trên SOF thường có dạng:
- Mình có lỗi abcxyz này, làm thế nào để fix được hả các bạn?
- Có ai biết làm sao để cái custom cái abc ra được cái xyz ko?
- ...
còn trên Quora thì kiểu như thế này:
- Làm thế nào để tôi trở thành 1 Data Scientist?
- Có ai có thể giải thích 1 một dễ hiểu cho tôi thuật toán abcxyz này nó như thế nào ko?
- ...
- Thực ra thì mình không thường xuyên lướt Quora lắm Nhưng giả sử nếu search google mà có được mấy link giải thích bên Quora thì thường dễ hiểu hơn hẳn. Hơn nữa, với một câu hỏi sẽ thường sẽ có khá nhiều các câu trả lời được đưa ra, bạn có thể tham khảo và upvote cho câu trả lời ưng ý nhất hoặc trực tiếp tham gia trả lời cho câu hỏi đó.
-
Social Network lớn nhất thế giới hiện nay. Ngoài việc giải trí bằng việc lướt newsfeed, các bạn có thể tham gia vào 1 số group trao đổi trên facebook, follow những tác giả hoặc người có tầm ảnh hưởng mà bạn quan tâm và nhấn "See First", nhằm tối đa hoá khoảng thời gian rảnh rỗi. 1 vài group về AI, Machine Learning tiêu biểu mình có tham gia như:
Youtube
- Ngoài cách học và tiếp cận với các nguồn thông tin dạng text, các nguồn tài liệu dạng video cũng có khá nhiều và dễ hiểu. Một số channel về Machine Learning, Deep Learning đáng chú ý:
- Two Minute Papers - Paper review channel. 1 trong những channel mình thấy thích nhất. Channel tập trung làm các video ngắn, trên dưới 5 phút, nhằm review qua các paper đạt được các thành tựu nhất định trong thời gian gần đây.
- Giant Neural Network - Introduction to Neural Network. Ô này có loạt bài giới thiệu về Neural Network, các bạn có thể xem tại đây
- Deep Learning dot AI - Deep Learning course by Andrew Y. Ng (Stanford). Gồm các video bài giảng trong khoá học về Deep Learning của Andrew Y. Ng trên coursena, các bạn có thể tham khảo khoá học tại đây
- Hvass Laboratories - Tensorflow Tutorial. Ô này có loạt bài về Tensorflow mà mình thấy vô cùng ưng ý.
- Code Bullet - Reinforcement Learning
- 3Blue1Brown - Introduction to Neural Network
- DeepMind
Các phương tiện khác
- Một số website
- Github: bằng việc follow các tác giả nổi tiếng hay main contributor của các project, mỗi khi họ tạo mới, commit, push, cho star hay fork bất kì 1 repo sẽ đều hiện lên bảng tin bên github của bạn. 1 cách thức khác các bạn có thể thực hiện là nhấn
Watch
đối với những repo bạn quan tâm hoặc muốn contributor cho project đó; bất kì 1 commit nào được thực hiện trên repo gốc, bạn sẽ đều nhận được thông báo. - Google Scholar: bạn follow các tác giả mà bạn quan tâm, có thể tuỳ chọn thông báo qua email về các bài viết mới, các lời trích dẫn đến tác giả hoặc các bài viết mới liên quan đến nghiên cứu của tác giả này.
- Antiny-Sanity: gồm các paper trending theo thời gian. 1 điểm khá hay là tác giả cũng build 1 mục recommend các paper có liên quan dựa trên các paper bạn đã save lại.
- Facebook Research
- Researchgate
- Github: bằng việc follow các tác giả nổi tiếng hay main contributor của các project, mỗi khi họ tạo mới, commit, push, cho star hay fork bất kì 1 repo sẽ đều hiện lên bảng tin bên github của bạn. 1 cách thức khác các bạn có thể thực hiện là nhấn
- Trước mình cũng có tổng hợp thành 1 nguồn tài liệu: Data Science Resource gồm các khoá MOOC, Free Ebooks, Roadmap, Newsletter, .. mà mình thấy hữu ích về Data Science, Machine Learning; tuy nhiên vẫn còn thiếu sót khá nhiều và sẽ tiếp tục được cập nhật trong tương lại. Hi vọng sẽ có ích cho các bạn! Any Contributor is welcome
Lời kết
- Trên đây là 1 số cách thức giúp mình cập nhật được các thông tin mới nhất trong lĩnh vực Machine Learning. Mọi người còn cách tiếp cận khác có thể comment bên dưới để cùng nhau học hỏi nhé. Mọi ý kiến phản hồi xin gửi mail về địa chỉ: phan.huy.hoang@framgia.com. Cảm ơn các bạn!
Reference
-
1 số nguồn thông tin trong này mình có tham khảo từ 1 post trong forum Machine Learning cơ bản (gồm cả comment của mình nữa ), rất cảm ơn các bạn đã đóng góp chia sẻ https://www.facebook.com/groups/machinelearningcoban/permalink/489305238193555/
-
1 số bài blog các bạn có thể tham khảo thêm:
All Rights Reserved