Thị giác máy tính là gì? Các vấn đề liên quan tới thị giác máy tính
Bài đăng này đã không được cập nhật trong 4 năm
1. Giới thiệu về thị giác máy tính.
Thị giác máy tính là một lĩnh vực đã và đang phát triển mạnh mẽ trên thế giới. Khái niệm thị giác máy tính có liên quan tới nhiều ngành học và có nhiều hướng nghiên cứu khác nhau. Kể từ những năm 70 của thế kỉ 20 khi mà khả năng tính toán của máy tính trở nên mạnh mẽ hơn, nó có thể giải quyết được các công việc yêu cầu tốc độ cao xử lí các tệp ảnh hay đoạn video mà thị giác máy tính được nhắc đến, nghiên cứu và phát triển đến nay.
Thị giác máy tính là một vấn đề rất mới mẻ đối với các nhà nghiên cứu tại Việt Nam.Việc nghiên cứu và phát triển các ứng dụng thị giác máy tính mở ra nhiều tiềm năng và khả năng ứng dụng thực tiễn mạnh mẽ cho chặng đường nghiên cứu tại Việt Nam.
2. Thị giác máy tính là gì?
Theo Wikipedia, thị giác máy tính (Computer vision: xử lí và nhận dạng hình ảnh) là một lĩnh vực bao gồm các phương pháp thu nhận, xử lý ảnh kỹ thuật số, phân tích và nhận dạng các hình ảnh và, nói chung là dữ liệu đa chiều từ thế giới thực để cho ra các thông tin số hoặc biểu tượng, ví dụ trong các dạng quyết định. Nói một cách đơn giản hơn, thị giác máy tính nhằm tạo ra một hệ thống nhân tạo có thể tiếp nhận các hình ảnh thu được hay tập dữ liệu đa chiều để phân tích, xử lí nó theo ý muốn.
Máy móc ngày càng thông minh, nó không chỉ thay thế con người làm những công việc tính toán đơn giản đến khó khăn, mà nó còn có khả năng bắt chước động vật và con người. Một trong số những khả năng đó là nhận biết được thế giới qua “mắt” của nó. Bằng việc kết hợp các mô hình khác như: máy học, mạng noron, … giúp cho chúng dần tiến tới một hệ thống nhân tạo có những quyết định linh hoạt và chính xác hơn.
Thị giác máy tính bao gồm các lĩnh vực sau:
- Xử lí hình ảnh: Phát triển các thuật toán xử lí ảnh như tăng/giảm chất lượng ảnh, lọc nhiễu...
- Nhận diện mẫu: Giải thích các kỹ thuật khác nhau để phân loại mẫu.
- Quang trắc: Liên quan đến việc thu thập các số đo chính xác từ hình ảnh.
3. Xử lí ảnh là gì?
Xử lí ảnh là một trong những mảng quan trọng nhất trong kỹ thuật thị giác máy tính, làm tiền đề cho nhiều nghiên cứu sau này. Nó là một lĩnh vực mang tính khoa học và công nghệ. Xử lí ảnh là một ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát triển của nó rất mạnh mẽ, kích thích các trung tâm nghiên cứu.
Hai nhiệm vụ cơ bản của xử lí ảnh là nâng cao chất lượng thông tin hình ảnh và xử lí số liệu cung cấp cho các quá trình khác trong đó có việc ứng dụng thị giác vào điều khiển. Xử lí ảnh trước đây chủ yếu được sử dụng làm nâng cao chất lượng ảnh (gia tăng chất lượng ảnh quang học trong mắt người quan sát). Thời gian gần đây, phạm vi ứng dụng xử lí ảnh mở rộng không ngừng, có thể nói hiện không có lĩnh vực khoa học nào không sử dụng các thành tựu của công nghệ xử lí ảnh kĩ thuật số.
4. Các ứng dụng của thị giác máy tính
Thị giác máy tính là một chuyên ngành đã phát triển khá lâu và có nhiều ứng dụng rộng rãi trong đời sống, giúp cho máy tính “nhìn” được như con người. Nó đã được ứng dụng rộng rãi trong nhiều lĩnh vực, các thành tựu nổi bật đáng kể đến như:
Trong y học, các thuật toán xử lí ảnh cho phép biến đổi hình ảnh được tạo ra từ nguồn bức xạ X-ray hay nguồn bức xạ siêu âm hình ảnh quang học trên bề mặt phim x-quang hoặc trực tiếp lên bề mặt màn hình hiển thị. Hình ảnh các cơ quan chức năng của con người được xử lí tiếp nâng cao độ tương phản, lọc, tách các phần cần thiết hay tạo ra hình ảnh không gian 3 chiều (siêu âm ba chiều). Mới nhất hiện nay, thị giác máy tính tạo ra ứng dụng giúp hỗ trợ thị giác cho người mù…
Trong lĩnh vực địa chất, kỹ thuật làm nổi đường biên và khôi phục hình ảnh giúp nâng cao chất lượng vệ tinh tạo ra bản đồ địa hình 3D với độ chính xác cao.
Trong khí tượng học, ảnh thông qua vệ tinh, đưa ra các thông tin Trái Đất trên một vùng rộng lớn, giúp cho việc dự báo thời tiết chính xác hơn.
Trong lĩnh vực hình sự và bảo mật, kiểm soát truy cập, trong quá trình xử lí nhận dang vân tay, khuôn mặt hay nhận dạng biển số xe giúp phát hiện nhanh đối tượng nghi vấn, cũng như nâng cao quá trình bảo mật, giám sát hay nhận dạng mục tiêu trong lĩnh vực quân sự.
Không chỉ thế, thị giác máy tính ứng dụng trong việc điều khiển tiến trình như các robot trong công nghiệp, hay các thiết bị, xe tự hành hay trong các quá trình kiểm tra trong môi trường công nghiệp, …
Ngoài ra, thị giác máy tính còn có vai trò tương tác (đóng vai trò làm đầu vào cho thiết bị trong quá trình tương tác giữa người và máy).
5.Các thư viện mã nguồn mở
Chúng ta có thể tận dụng những thành quả của cộng đồng mã nguồn mở để áp dụng cho ứng dụng thị giác máy tính của mình. Hiện nay trên thế giới có rất nhiều thư viện mã nguồn mở cho ta sử dụng, như:
- Intel OpenCV
- CMCVision
- ImLib 3D
- ImaLab….
Đó là những thông tin cơ bản về thị giác máy tính và ứng dụng của nó mà mình muốn chia sẻ. Mình mong rằng, những thông tin cơ bản này, giúp các bạn hiểu thêm về một lĩnh vực đang được quan tâm và phát triển hiện nay.
Trong bài chia sẻ sắp tới, dựa và openCV, mình sẽ giới thiệu với các bạn các vấn đề trích chọn đặc trưng và nhận dạng dựa vào màu sắc.
All rights reserved