Nhờ mọi người download giup bài báo này trên ieee được không a? https://ieeexplore.ieee.org/abstract/document/1442203
@biendv Mình gửi bạn nhé A review of ship detection algorithms in polarimetric SAR images
Django or Nodejs
@chickenhuhii Câu trả lời nằm ở định hướng của bạn. Nếu chỉ thiên hướng về làm backend và web thì mình thấy cả hai đều phù hợp để bạn rèn luyện tư duy. Còn trong dự án thực tế (nhất là các dự án out source với khách hàng) thì thông thường sẽ cần biết nhiều hơn thế, và cũng không nên bó buộc mình trong một công nghệ nào cả. Tuỳ thuộc vào yêu cầu dự án mà lựa chọn công nghệ cho phù hợp. Cá nhân mình làm bên mảng dữ liệu và machine learning nên vote cho Django hơn vì nó base trên Python và cũng dễ dàng tích hợp với các ứng dụng AI hơn. Nhất là nếu ứng dụng của bạn không có nhiều logic đặc thù phía admin thì mình thấy trang Admin mặc định của Django là đủ dùng mà không cần code lại các thao tác CRUD cơ bản. Tóm lại là chỉ có bạn mới biết bạn nên học gì. Và theo quan điểm của mình thì hãy cố gắng hiểu bản chất của vấn đề chứ đừng bị phụ thuộc vào framework, ngôn ngữ hay công cụ nào cả. Chúc bạn sớm tìm ra được hướng đi phù hợp với bản thân và định hướng nghề nghiệp của mình
Cài đặt chatbot cho website, mạng xã hội"
@thinh24 Bạn phải nói rõ là sử dụng mạng xã hội nào thì mới có case study cụ thể (Ví dụ Zalo, Facebook, Twitter, Telegram.). Nhưng tư tưởng chính thì vẫn sẽ là bạn deploy RASA lên một server nào đó rồi sẽ sinh ra cho bạn một callback URI. Bạn sử dụng callback URI này để lắng nghe và xử lý các thông tin được gửi đến từ các nền tảng mạng xã hội kia. Mỗi một nền tảng sẽ có một SDK riêng để cung cấp các credentials. Bạn tạo tài khoản, lấy access token, app id ... rồi config vào trong credentials.yml khi chạy RASA là được. Bạn có thể search thêm từ khoá RASA + Tên mạng xã hội + integration sẽ ra nhiều hướng dẫn hơn
Tìm hiểu về Học Biểu Diễn (Representation Learning)
@dunght004 Representation Learning thì khá rộng tuỳ thuộc vào các downstream task mà bạn muốn áp dụng thì sẽ có các cách học biểu diễn khác nhau sao cho phù hợp. Bạn có thể tìm hiểu một số hướng mình thấy khá tiềm năng trong thời gian gần đây như self-supervised learning, contrastive learning...
Cách thiết kế mạng CNN cho bài toàn input là image, out là image
@BruceKieu Mình có một vài suggest cho bạn như sau:
- Thứ nhất: Mình thấy dữ liệu dạng này khá đặc thù nên bạn có thể cân nhắc xem liệu có thể sử dụng thêm các thông số khác ngoài dữ liệu ảnh về trường sóng địa chấn làn đầu vào hay không (ví dụ các dạng dữ liệu thu được từ các cảm biến khác chẳng hạn)? Vì mình không có background về mảng này nên cũng không chắc là về mặt đặc trưng thì trường sóng dạng hình ảnh này có thích hợp để sử dụng dự đoán ra mô hình vận tốc hay không. Nếu được thì bạn nên chọn lựa các feature phù hợp thì mô hình sẽ cho chính xác hơn
- Thứ hai: Giả sử bạn đang chọn đúng các dữ liệu đầu vào thì như câu hỏi bạn nêu mình thấy bạn có thể tiếp cận theo các mô hình encoder - decoder thường áp dụng tương tự cho các bài toán segmentation như Unet hoặc các kiến trúc khác. Nếu bạn dùng PyTorch thì có thể tham khảo sẵn các kiến trúc segmentation mới nhất được implement tại đây. Bạn cứ thử nghiệm thử các kiến trúc này trước để xem có thực sự hiệu quả không
Chúc bạn vui vẻ
[Deep Learning] Đánh giá chất lượng cây trồng thông qua ảnh (Evaluating quality of crops via images)
Việc đầu tiên bạn cần quan tâm đến đó là dữ liệu. Có ý định thử nghiệm trên bộ dữ liệu sẵn nào không. Nếu không có dữ liệu có săn thì thu thập dữ liệu như thế nào. Xử lý nếu trực tiếp trên Pi thì nên thử nghiệm các phương pháp xử lý ảnh kết hợp với các thuật toán ML như SVM, Random Forest để gia tăng tốc độ. Sau đó hãy nghĩ đến việc thử cải tiến bằng Deep Learning. Hơn nữa nếu bạn định dùng Rapberry Pi để sử dụng chụp ảnh trên môi trường thực thì phải quan tâm đến việc duy trì nguồn điện như nào. Có cần kết nối với Wifi để gửi dữ liệu về hay không. Từ đó lựa chọn các thiết bị như PIN, Module kết nối mạng (3G hay Wifi) cho phù hợp
Chúc bạn thành công
Có thể inference 1 model nhiều lần tại 1 thời điểm không? (pytorch , cpu)
Theo như mình hiểu thì mỗi khi cần inference bạn lại load lại model nên dẫn đến việc tràn bộ nhớ (mỗi request lại load lại model 1 lần => trên máy vật lý tồn tại nhiều version khác nhau của 1 model ) nên chỉ có thể giới hạn số lượng request. Nếu thực sự bạn đang code như vậy thì bạn có thể sửa lại theo một số hướng:
- Chỉ load model 1 lần trong 1 file constructor và load nó sẽ được chạy một lần khi run server và lưu lại ở trên RAM
- Sử dụng ONNX convert model sang dạng pb của Tensorflow và sử dụng Tensorflow Serving để cải thiện tốc độ và tách phần model chạy độc lập với API
- Sử dụng Redis Cache để gom số lượng request lại vào một batch và tiến hành inference 1 lần trên model. Tận dụng sức mạnh tính toán của phép nhân ma trận thay vì tình rời rạc từng request 1.
- Tối giản lại mạng, nếu bạn đang sử dụng một kiến trúc quá lớn thì nên tìm cách cắt giảm số lượng parameters trong tính toán bằng một số kĩ thuật như model prunce, knowledge distiller
- Nâng cấp RAM và GPU cho hệ thống
Ngoài ra nếu thực sự vì một lý do nào đó mà server của bạn chỉ có thể thực hiện được với số lượng request như vậy dù bạn đã thực hiện đúng các cách trên thì bạn có thể tìm hiểu thêm về các kĩ thuật scale và load balance server để adaptive được hệ thống khi có số lượng request quá lớn
Hi vọng sẽ giúp được bạn.
Xử lý ảnh
Bài toán này có thể chia làm 2 pharse là detect các kí tự (object detection) và pharse OCR. Với pharse detect các kí tự bạn có thể sử dụng các mô hình Deep Learning cho Object Detect để đạt độ hiệu quả cao tất nhiên đổi lại thì công súc chuẩn bị dữ liệu phải nhiều, đủ độ đa dạng về kích thước, điều kiện ảnh sáng, điều kiện môi trường (có bụi bẩn, kính công tơ bị mờ). Để đảm bảo tốc độ bạn nên custom các mô hình object detect của riêng mình hoặc nếu chưa có kinh nghiệm thì có thể sử dụng một số mô hình cho tốc độ tốt như SSD-Mobilenet vì các object trong trường hợp này cũng khá đơn giản. Sau khi cắ được các object thì có thể sử dụng một mạng CNN thông thường với 10 class để phân biệt từng số thay vì dùng một mạng sequence to sequence vì số lượng các kí tự đã cố định rồi.
Cách cookpad xử lý tag, bài viết liên quan
Bạn có thể sử dụng AI trong bài toán này nhé. Theo mình thì đây là bài toán phân loại hình ảnh khá phổ biến trong Deep Learning. Bạn có thể tìm hiểu các từ khóa về image classification và CNN hoặc có thể tham khảo bài viết này
Sau khi bạn nhận dạng ra là món ăn gì thì cần mapping nó với một DB để có thể ra được các nguyên liệu tương ứng với món ăn đó.
Thân
Nhờ tư vấn về thu thập dữ liệu
Chào bạn bạn có thể tham khảo hai opensource khá nổi tiếng có chức năng gần giống như GA (có dashboard, xem heatmap của trang ... ) nhưng có thể cài cắm trên server của mình và custom được source đó là Countly và Matomo
Nhận diện giọng noi
Mình cũng có một chút ít kinh nghiệm trong mảng này nên hi vọng có thể giúp được bạn chút ít.
Bạn có thể xem qua video demo mà bên mình test hệ thống phát hiện phát âm sai cho tiếng anh ở link Video dưới đây.
Rất cảm ơn bạn đã đặt câu hỏi trên Viblo
Hỏi về giá trị stride trong faster R-CNN?
Mình cũng nghĩ nó sẽ dừng ở block thử 3. Nếu bạn dùng maxpooling2d qua mỗi lớp maxpool sẽ có stride=2 nên với strides=16 sẽ cần qua 4 block 24=16. Nếu strides=8 thì cần 3 block 23=8
Nên dùng model/solution nào detect vật nhỏ trong ảnh lớn?
Bạn thử tìm hiểu phương pháp này xem
Cách tạo ra bounding box trong YOLO?
Chào bạn. Câu hỏi của bạn có lẽ đang nói đến YOLOv2. Như phần trên bạn đã đưa ra câu hỏi. YOLO sẽ chia ảnh của chúng ta thành các ô cố định (giả sử grid có kích thước10x10) và trong mỗi ô nhỏ đó sẽ chịu trách nhiệm dự đoán một object nếu như tâm (centroid) của object được phát hiện nằm trong ô nhỏ này (tức là conffidence score lớn hơn một ngưỡng nào đó giả sử là 0.25).
- Dựa vào đâu để hình thành bounding box?
Để dự đoán người ta sử dụng CNN layers để dự đoán các tham số của box chứa object dựa vào các box mẫu (anchor boxes) tức là các box có kích thước được định nghĩa trước. Giống như trong Faster RCNN sau đó dựa vào các box mẫu này để tinh chỉnh tọa độ cho phù hợp với objects.
- Dùng k-clustering ra sao?
Để training ra các anchors này chúng ta cần sử dụng K-Clustering và cần phải có một độ đo để dùng làm hàm loss. Như trong YOLOv2 sử dụng IOU (Intersection Over Union, thể hiện độ khớp của prediction box so với ground-truth box). Thay đổi số lượng centroids cho phù hợp với nhu cầu của bạn (về cơ bản càng nhiều cụm thì chỉ số IoU càng tăng - càng khớp với ground-truth)
Nhờ mọi người khai thông về việc ứng dụng AI vào Business Analysis.
Theo mình nghĩ thì ý của bạn là:
- Hiện tại đang có dữ liệu về các chỉ số kinh doanh trong khoảng thời gian (ví dụ từ 2000 đến 2018) trong đó bao gồm các số liệu như sản lượng, số lượng nhân viên, số giờ làm việc, doanh thu, số lượng khách hàng, lợi nhuận, số nợ ...
- Muốn dựa vào các thông số đó để đưa ra (dự đoán) được các hướng giải quyết tiếp theo.
Với dạng bài toán này bạn có thể tham khảo một số hướng tiếp cận:
-
Thứ 1: Có thể coi dữ liệu của bạn thuộc vào dạng time series tức là việc coi rằng dữ liệu trong quá khứ (nguyên nhân) sẽ có ảnh hưởng đến dữ liệu (kết quả) của thời điểm hiện tại. Bạn có thể tìm hiểu theo từ khóa time series analysis for business forecasting.
-
Thứ 2: Có thể coi bài toán của bạn dưới dạng Feature Engineering và Regression tức là tìm ra các đặc trưng trong dữ liệu và các mối liên quan giữa chúng. Ví dụ sự liên quan giữa lợi nhuận và các khoản còn lại. Và việc của mô hình bạn xây dựng sẽ để học các mối liên quan đó. Sau khi mô hình học xong sẽ cho ra các trọng số xác định độ quan trọng (mức độ liên quan) giữa các đại lượng khác đến lợi nhuận của bạn, từ đó cho bạn bức tranh tổng quát về tình hình kinh doanh, và gợi ý cho bạn cần phải thay đổi những điều gì.
-
Thứ 3: Machine Learning chỉ là một bước đi tiếp sau để cải tiến hiệu quả của các mô hình thống kê và tư vấn chuyên gia nên mình nghĩ trước tiên bạn nên phân tích các đại lượng thống kê, các chỉ số thật kĩ trước khi áp dụng ML vào bài toán này
Một vài ý kiến hi vọng có thể hữu ích với bạn.
code php download url ảnh về serve
Bạn có thể sử dụng thư viện này có hỗ trợ download các ảnh theo keyword luôn
Trí tuệ nhân tạo nên bắt đầu từ đâu?
Nếu bạn là công ty đang kinh doanh thì mình khuyên là nên thuê một đội ngũ chuyên gia để tư vấn, triển khai và quản lý hệ thống giúp bạn vì mình thấy với yêu cầu của bạn khá chung chung. Còn nếu bạn đang muốn thực hiện một dự án cá nhân với mục tiêu học hỏi thì mình có thể gợi ý cho bạn một số ý như sau:
Bạn cần tư vấn cho khách hàng theo hình thức như thế nào? Mình thử dưa ra một vài ý tưởng cho bạn nhé.
-
Tư vấn theo dạng kênh giao tiếp bằng tin nhắn: Đây là một hình thức tư vấn gọi là Chatbot, tức là khi khách hàng nhắn tin đến cho công ty của bạn, máy sẽ tự động trả lời lại để tư vấn các sản phẩm phù hợp. Tức là máy có thể hiểu được yêu cầu của con người.
-
Tư vấn theo dạng kênh giao tiếp bằng giọng nói: Thêm vào bước Chatbot bên trên là hai hệ thống biến giọng nói thành chữ (Speech to text) và ngược lại (Text to speech) để gúp cho người dùng có thể giao tiếp với hệ thống của bạn thông qua giọng nói như giao tiếp thông thường
-
Tư vấn dựa trên xử lý hình ảnh (Computer Vision): hãy tưởng tượng bạn sử dụng camera để nhận diện hình ảnh của bạn và hệ thống sẽ tư ván cho khách hàng những gu thời trang và các sản phẩm quần áo phù hợp.
Sau khi bạn có được ý tưởng rồi thì liên hệ với mình mình sẽ tư vấn tiếp giúp bạn.
[Android] App dịch morse.
Theo mình bạn có một vài lựa chọn tùy vào mức độ phức tạp của yêu cầu bài tập lớn:
Về cơ bản bài toán này bao gồm 4 bước chính:
-
ghi âm morse code từ microphone
-
nhận dạng thời gian bắt đầu và kết thúc của các tones
-
xây dựng chuỗi các dots and dashes.
-
dịch chúng thành text
Vậy bạn có thể có hai cách để thực hiện
-
Sử dụng các package có sẵn của Android, bạn có thể tham khảo một project mẫu tại đây.
-
Xây dựng bộ nhận dạng thủ công. Về cơ bản thì morse code dạng âm thanh của một kí tự là không thay đổi. Bạn cần chuẩn bị tập dữ liệu mẫu các morse code này. Tuy nhiên khi đọc vào từ micro thì sẽ có nhiễu khiến cho âm thanh thu được không còn giống như morse code mẫu nữa do đó bạn cần phải tìm xem âm đọc vào gần đúng nhất với morse code nào. Đây là một bài toán (recognition - nhận dạng) và bạn có thể áp dụng phương pháp tính độ tương tự để tìm độ tương tự lớn nhất cho âm được đọc vào từ micro. Cách này đơn giản nhưng độ chính xác không cao. Để nâng cao độ chính xác bạn có thể sử dụng các phương pháp Machine Learning như SVM hoặc mạng nơ ron nhân tạo để cải thiện độ chính xác của bài toán nhận dạng.
Chúc bạn thực hiện bài tập lớn thành công
Hỏi về việc xây dựng chức năng Run code trực tiếp trên web
Đầu tiên bạn cần có một editor để mọi người có thể vào viết code bạn có thể tham khảo editor này
Sau đó bạn cần gửi code lên server để biên dịch code đó và cuối cùng là hiển thị kết quả trả về phía client-slide. Nếu bạn sử dụng Javascript thì có thể render trực tiếp kết quả này trên trình duyệt của người dùng.
Bạn có thể tham khảo một số service đã hỗ trợ sẵn cả 3 tính năng trên như anh bạn CodePen hoặc anh bạn Plunkr.
Ngoài ra bạn có thể chạy một số complier phía client như Brython nhưng theo mình nghĩ nó không được đầy đủ.
Machine learning
Mình chưa hiểu ý của bạn lắm. Có phải bạn muốn tìm một mô hình máy học để nhận dạng chữ số nào ở tọa độ (x, y) trên bàn cờ không