Đôi mắt con người - thách thức của công nghệ AI

Chủ Nhật, 30/10/2022, 12:52

Đạt được sự đa dạng trong tầm nhìn của con người là một trong những thách thức lớn đối với nghiên cứu trí tuệ nhân tạo (AI). Trong phần lớn các trường hợp, chúng ta giỏi hơn máy móc trong việc hiểu thế giới xung quanh. Nhưng máy móc đang bắt kịp - chậm mà chắc.

Michael Felsberg, giáo sư Đại học Linkping và là một trong những nhà nghiên cứu hàng đầu của Thụy Điển về thị giác máy tính và trí tuệ nhân tạo(AI), cho biết: “Trong vòng một ngày, con người chúng ta có thể đi từ lái ô tô đến lặn tự do, vừa đọc báo vừa điều hướng trong một khu rừng rậm - tất cả đều không cần nỗ lực nhiều. Đối với robot, làm những điều tương tự hiện tại là điều không thể”. Con người chúng ta có thể làm được tất cả những điều này, và hơn thế nữa, phần lớn là nhờ vào đôi mắt. Đó là giác quan quan trọng nhất để nhận thức những gì xảy ra xung quanh chúng ta.

image001.jpg -0
Xe tự hành và máy bay không người lái là một số lĩnh vực ứng dụng hiện tại cho nghiên cứu của Michael Felsberg và nhóm của ông thực hiện

Nghiên cứu của Michael Felsberg chủ yếu tập trung vào hệ thống thị giác nhân tạo, với mục đích là giúp máy tính có thể nhìn tốt như con người. “Các hệ thống sinh học hoạt động đơn giản. Con người có kỹ năng đáng kể trong nhận thức và phân tích nói chung, những kỹ năng mà chúng ta muốn mô phỏng trong máy tính. Ngày nay, chúng ta có thể xây dựng các hệ thống kỹ thuật thực hiện tốt một nhiệm vụ cụ thể, chẳng hạn như ôtô tự lái. Tầm nhìn máy tính nói chung đã phát triển thành một trong những thách thức nổi bật nhất trong nghiên cứu AI”.

Michael Felsberg và đồng nghiệp thử nghiệm nhiều giải pháp mà họ phát triển trong phòng thí nghiệm thị lực ở Campus Valla ở Linkoping. Ví dụ, giữa những bức tường kính khổng lồ, máy bay không người lái và ôtô tự lái nhỏ trang bị cảm biến và camera tiên tiến đang được lái thử. Nhưng bộ não thực tế trong tầm nhìn máy tính nằm sau ống kính.

Đã có nhiều nỗ lực mô phỏng bộ não con người - với nhiều kết quả khác nhau. Ngày nay, phương pháp học máy được gọi là học sâu thường được sử dụng. Nói một cách đơn giản, nó có nghĩa là máy tính học các mô hình của nó được tổ chức trong mạng nơ-ron từ một lượng lớn dữ liệu. Thuật toán được cung cấp với lượng dữ liệu khổng lồ, được phân tích ở nhiều cấp độ. Điều này nghe có vẻ phức tạp, và đúng là như vậy.

Michael Felsberg vẽ ra những điểm tương đồng với bộ não con người: “Khi quét não, bạn có thể thấy phần nào của não đang hoạt động trong một số kích thích khác nhau. Nhưng chúng ta vẫn chưa biết điều gì thực sự xảy ra và cách hình thành ý nghĩ trong não. Học sâu hoạt động theo cách tương tự. Chúng ta thấy nó hoạt động, nhưng không phải cách hoạt động chi tiết”. Nhưng tại sao máy tính lại khó nhìn thấy những gì chúng ta thấy? Câu trả lời nằm ở khả năng thích ứng nhanh chóng với mọi tình huống khác nhau và vòng lặp phản hồi giữa nhận thức về môi trường xung quanh cũng như khả năng nhận thức tích cực liên tục của chúng ta.

Nhìn ra ngoài qua ô cửa sổ là ví dụ hàng ngày về tình huống máy tính gặp khó khăn nhưng con người chúng ta lại xoay sở một cách dễ dàng. Chúng ta nhìn thấy ngay những gì đang diễn ra bên ngoài cửa sổ, mặc dù tầm nhìn hơi bị che khuất. Mặt khác, trước tiên máy tính sẽ tự động lấy nét vào bụi bẩn trên khung. Nhưng một khi đã tìm đúng trọng tâm - vào cảnh bên ngoài - thì nó vẫn sẽ không hiểu hết chuyện gì đang xảy ra, bởi vì một số tầm nhìn đã bị che bởi bụi bẩn.

Tuy nhiên, có những lĩnh vực mà máy tính nhìn thấy tốt hơn con người - đặc biệt khi nói đến những phép tính và đánh giá chính xác về khoảng cách, nhiệt độ và các mẫu. Trong những trường hợp này, thị giác máy tính có thể bổ sung cho tầm nhìn của chính chúng ta, thay vì tự rút ra kết luận và hành động theo chúng. Michael Felsberg bình luận: “Một hệ thống kỹ thuật hoạt động tốt miễn là mọi thứ đều như mong đợi. Nhưng đối mặt với điều gì đó không mong muốn, nó sẽ có vấn đề. Chúng ta phải nghiên cứu giúp cho hệ thống mạnh mẽ hơn”.

Nhưng việc phát triển phần mềm có thể vượt qua sự linh hoạt của thị giác con người cần có thời gian. Và theo Michael Felsberg, nghiên cứu đòi hỏi mất thời gian nếu muốn nó trở nên mạnh mẽ. Khoa học là một quá trình, và mỗi bài báo nghiên cứu mới lại thêm một phần nhỏ khác vào câu đố lớn. Những đột phá mang lại cho nghiên cứu bước tiến nhảy vọt là rất hiếm. Khi thị giác máy tính tổng quát tồn tại, Felsberg tin rằng sẽ có nhiều ứng dụng khác nhau - ví dụ như robot xã hội, phương tiện tự hành an toàn hơn và sản xuất hiệu quả hơn.

Nhưng AI lại vấp phải một vấn đề khác. Nhiều lĩnh vực sử dụng có nguy cơ xâm phạm quyền riêng tư cá nhân khi khối lượng lớn dữ liệu cá nhân được xử lý. Vì lý do này, Michael Felsberg và nhóm nghiên cứu của ông đang tập trung vào cách AI có thể cung cấp cái nhìn sâu sắc hơn về cách chúng ta ngăn chặn biến đổi khí hậu: “Biến đổi khí hậu là một trong những mối đe dọa lớn nhất của nhân loại. Sử dụng tầm nhìn máy tính tiên tiến, chúng ta sẽ có thể nhanh chóng phân tích những vùng đất rộng lớn và tầm quan trọng của chúng đối với khí hậu. Con người sẽ mất vài năm để vạch ra một cách thủ công có thể hoàn thành vài tuần với sự trợ giúp của AI”.

Trang Thuần (Tổng hợp)
.
.