Những thăng trầm của trí tuệ nhân tạo

08.02.18, 14:00 GMT+7

Microsoft phải gỡ bỏ chương trình tương tác con người trên Twitter hay AlphaGO đánh thắng vô địch cờ vây thế giới là những thăng trầm trong thời gian gần đây trong lĩnh vực trí tuệ nhân tạo (AI).

Theo Live Science, một bước tiến lớn của AI là sự kiện chương trình máy tính của Google đánh cờ vây thắng áp đảo đương kim vô địch thế giới hồi tháng ba. Đây là trò chơi chiến thuật cổ của Trung Quốc, phức tạp hơn cờ vua và được coi là một chuẩn mực để đánh giá sự tiến bộ của AI.

Nhung-thang-tram-cua-tri-tue-nhan-tao-1Nhiều tiến bộ của AI gần đây đến từ phương pháp dạy máy tính deep learning

Một tuần sau đó, Microsoft thiết kế một chương trình máy tính khác tên là Tay mô phỏng một cô gái 19 tuổi người Mỹ để học hỏi từ những tương tác với con người trên Twitter. Theo Microsoft, hệ thống AI này có thể giao tiếp với con người ngày một tốt hơn nhờ học hỏi những người tweet đến nó.

Tuy nhiên, họ đã phải tắt hệ thống này 16 giờ sau đó, khi Tay bắt đầu đưa ra những tuyên bố phân biệt chủng tộc, giới tính và khiêu dâm. Microsoft sau đó đã phải xin lỗi và giải thích đã xảy ra một vụ “tấn công phối hợp” vào các “lỗ hổng” và “lỗi kỹ thuật” của Tay.

Dù Microsoft cho rằng họ là nạn nhân của tin tặc, nhưng theo Bart Selman, một giáo sư về khoa học máy tính tại Đại học Cornell, cái gọi là “lỗ hổng” thực chất là việc Tay lặp lại các cụm từ được tweet tới nó mà không qua bất kỳ công cụ lọc nào. Ông cho rằng đây là một trong những nhược điểm chính của AI hiện nay: kỹ năng đọc hiểu ngôn ngữ.

Dạy cho trí tuệ nhân tạo
AI rất giỏi phân tích cú pháp văn bản, nghĩa là, làm sáng tỏ những mẫu ngữ pháp là nền tảng cho một ngôn ngữ, theo Selman. Điều này cho phép các chương trình như Tay có thể đưa ra những câu phát biểu giống như người thật. Đây cũng là sức mạnh của các chương trình dịch tự động của Google và Skype.

“Nhưng hiểu ngữ nghĩa – ý nghĩa của câu là một việc khác hoàn toàn”, ông nói.

Nhiều tiến bộ gần đây của AI là nhờ vào phương pháp “học sâu – deep learning”, mà ở một số mức độ nào đó có thể mô phỏng quá trình hoạt động của các lớp tế bào thần kinh trong não bộ. Với dải dữ liệu khổng lồ, nó rất giỏi trong việc tìm kiếm các mẫu, nên các thành công lớn nhất của AI cho tới nay đều liên quan tới nhận diện hình ảnh hoặc giọng nói.

Trong khi cách tiếp cận truyền thống của việc dạy máy tính học là nói cho nó biết cần tìm kiếm cái gì để “học”, thì một trong những ưu điểm chính của deep learning là khả năng “tự động khám phá”, theo Shimon Whiteson, giáo sư khoa Khoa học máy tính, Đại học Oxford, Anh.

Nhung-thang-tram-cua-tri-tue-nhan-tao-2Các thành công lớn nhất của AI cho tới nay đều liên quan tới nhận diện hình ảnh hoặc giọng nói

Lớp đầu tiên của deep learning là tối ưu hóa để tìm các đặc điểm cơ bản nhất trong dữ liệu, ví dụ như các cạnh của một vật thể trong một bức ảnh. Dữ liệu đầu ra sẽ được chuyển tới lớp kế tiếp, quét các cấu hình phức tạp hơn, như hình vuông hay hình tròn. Quá trình này được lặp đi lặp lại trên các lớp với độ phức tạp tăng dần theo từng lớp, sao cho tới một lúc nào đó, nó có thể sử dụng các cấu trúc ở các mức thấp hơn để xác định một vật thể là ôtô hay xe đạp.

“Với deep learning, bạn chỉ việc đưa dữ liệu thô vào một mạng lưới thần kinh lớn nào đó, mà sau đó nó sẽ được đào tạo tới cuối”, Whiteson cho biết.

Điều này đã dẫn đến một số khả năng siêu phàm của AI. Selman nói hệ thống deep learning đã được chứng minh có thể làm tốt hơn các chuyên gia y tế trong việc chuẩn đoán bệnh từ ảnh chụp cộng hưởng từ MRI. Kết hợp cùng với phương pháp học tăng cường (reinforcement learning) để đưa ra chiến lược tối ưu, AI cũng thành công trong việc xây dựng các mô phỏng ảo chính xác, theo Kaheer Suleman, giám đốc công nghệ và đồng người sáng lập của công ty về AI tại Canada, Maluuba.

Đây cũng là cách mà chương trình AlphaGo của Google sử dụng để trở thành một chuyên gia cờ vây, tự chơi hàng triệu ván một mình, kết hợp các phương pháp này để nâng cao kỹ năng và phát triển chiến thuật.

Nhung-thang-tram-cua-tri-tue-nhan-tao-3AlphaGo tự chơi hàng triệu ván cờ vây một mình

Tuy nhiên, đây cũng là nhược điểm của phương pháp này.

“Thách thức lớn với AI là những lĩnh vực không có kho dữ liệu đã được phân loại và dán nhãn, hoặc trong các môi trường không thể mô phỏng tốt”, Suleman nói. “Ngôn ngữ là một lĩnh vực điển hình trong trường hợp này, Internet là một văn bản vô tận nhưng không nơi nào ‘dán nhãn’ ngữ nghĩa theo kiểu máy móc cả”.

Maluuba đang phát triển các thuật toán có thể đọc văn bản và trả lời các câu hỏi về văn bản đó, nhưng Suleman cho biết có một số tính năng của ngôn ngữ làm cho công việc trở nên đặc biệt khó khăn. Ngữ nghĩa trải rộng trên nhiều cấp độ, từ từ vựng tới cụm từ và câu. Chúng có thể kết hợp với nhau theo vô số cách mà mỗi người lại có lối nói riêng.

Ngoài ra, mọi ngôn ngữ đều trừu tượng. Từ ngữ là những biểu tượng đơn giản cho mọi thứ trong thế giới thực mà một cỗ máy không thể trải nghiệm được.

Không có sự truy cập vào các dữ liệu của cuộc sống trong một thế giới vật chất cùng với sự phong phú của những tương tác xã hội mà con người đã tích lũy từ lâu, nên không có gì ngạc nhiên rằng Tay không hiểu nghĩa từ “Holocaust” (cuộc tàn sát người Do Thái dưới thời Hitler).

“Deep learning rất tốt nhưng không phải là giải pháp tối ưu”, Whiteson nói. “Còn rất nhiều thứ thiếu sót. Nên bước tiếp theo đương nhiên là bổ sung gì cho deep learning để nó trở nên tốt hơn”.

Hướng tới tương lai
Dù còn nhiều thách thức, Maluuba đã công bố một báo cáo vào tháng 3/2016 trên arXiv, một kho lưu trữ trực tuyến các nghiên cứu, mô tả cách mà hệ thống của họ có thể trả lời các câu hỏi trắc nghiệm về văn bản không quen thuộc với độ chính xác 70%, vượt qua các hệ thống khác 15%.

Cách tiếp cận của Maluuba kết hợp deep learning với cấu trúc mạng lưới thần kinh, được thiết kế để tương tác với nhau theo cách hình thành hình thức thô sơ của lý luận. Công ty cũng đang làm việc với các hệ thống hội thoại để học cách đối thoại tự nhiên với con người.

Nhung-thang-tram-cua-tri-tue-nhan-tao-4AI tập trung vào ngôn ngữ có thể mang lại hữu ích đáng ngạc nhiên cho các ứng dụng

Selman nói rằng AI tập trung vào ngôn ngữ có thể mang lại hữu ích đáng ngạc nhiên cho các ứng dụng, nơi các đối tượng khá hạn chế. Ví dụ các đường dây nóng hỗ trợ kỹ thuật, theo ông dự đoán sẽ sớm được tự động hóa (đã có một vài nơi tự động hóa), hoặc các công việc hành chính tương đối cao cấp yêu cầu các tương tác theo thủ tục như cập nhật các bảng tính và gửi đi các email theo công thức.

“Vẫn tồn tại những yếu kém trong những công việc mở, khó kiểm soát, không những liên quan đến nhiều khía cạnh của trí tuệ con người mà còn yêu cầu phải thực sự hiểu được con người”, Selman nói.

Tuy nhiên, theo Whiteson, vẫn có những thành tựu đáng kể trong lĩnh vực AI, như xe tự lái của Google là một ví dụ điển hình. Lái xe trên đường cùng với con người không những yêu cầu phải hiểu luật giao thông, còn phải theo các chuẩn mực xã hội bất thành văn, cùng với các cách xử lý khi tránh va chạm xảy ra.

Những tiến bộ trong lĩnh vực AI và robot dẫn đến số lượng máy móc được sử dụng trong thế giới thực ngày càng tăng, khả năng tương tác với con người không còn là một mục tiêu viễn tưởng. Các nhà nghiên cứu vẫn đang tìm kiếm các cách tiếp cận mới giúp máy tính có thể cảm nhận và hiểu được thế giới xung quanh.

(Nguồn: vnexpress.net – Nguyễn Thành Minh )