30 thg 9, 2021

MUM: Một cột mốc mới của trí tuệ nhân tạo để hiểu thông tin

Có thể nhiều người trong chúng ta nghĩ rằng giờ đây Google Tìm kiếm đã quá thông minh để giải quyết mọi câu hỏi mà người dùng đưa ra. Nhưng không! Pandu Nayak, phó chủ tịch Google Tìm kiếm, cho biết rằng còn vô số thách thức mà ông và các cộng sự đang cố gắng giải quyết để Google Tìm kiếm hoạt động tốt hơn cho mọi người.

Trong bài viết sau đây, Nayak chia sẻ cách Google giải quyết một vấn đề mà nhiều người trong chúng ta có thể gặp phải: phải nhập nhiều truy vấn và thực hiện nhiều tìm kiếm mới nhận được câu trả lời cần thiết.


Hãy xem trường hợp này: Bạn đã leo núi Adams. Sắp tới, bạn định leo núi Phú Sĩ vào mùa thu và bạn muốn biết công việc chuẩn bị có gì khác. Hiện giờ Google vẫn có thể giúp bạn, nhưng sẽ mất nhiều tìm kiếm được xem xét kỹ - bạn phải tìm kiếm độ cao của từng ngọn núi, nhiệt độ trung bình vào mùa thu, độ khó của các con đường mòn đi bộ đường dài, thiết bị phù hợp để sử dụng, và hơn thế nữa. Sau một số tìm kiếm, cuối cùng bạn sẽ có thể nhận được câu trả lời mình cần.

Nhưng nếu bạn đang nói chuyện với một chuyên gia dã ngoại; bạn có thể hỏi một câu - "Tôi nên làm gì khác để chuẩn bị?"  Bạn sẽ nhận được một câu trả lời chu đáo có tính đến các đặc điểm riêng của nhiệm vụ này và hướng dẫn bạn nhiều điều cần xem xét.

Ví dụ này không phải là duy nhất - nhiều người trong chúng ta phải giải quyết các loại công việc yêu cầu nhiều bước với Google mỗi ngày. Trên thực tế, chúng tôi thấy rằng mọi người đưa ra trung bình 8 truy vấn cho các tác vụ phức tạp như thế này.

Các công cụ tìm kiếm ngày nay không đủ phức tạp để trả lời theo cách của một chuyên gia. Nhưng với một công nghệ mới được gọi là Mô hình hợp nhất đa nhiệm (Multitask Unified Model) hay MUM, chúng tôi đang tiến gần hơn đến việc giúp bạn với những loại nhu cầu phức tạp này. Vì vậy, trong tương lai, bạn sẽ cần ít tìm kiếm hơn để hoàn thành công việc.

Giúp bạn khi không có câu trả lời đơn giản

MUM có khả năng biến đổi cách Google trợ giúp bạn với các tác vụ phức tạp. MUM sử dụng khung chuyển văn bản thành văn bản T5 (1) và mạnh hơn BERT (2) 1.000 lần. MUM không chỉ hiểu ngôn ngữ mà còn vận hành nó. Nó được đào tạo trên 75 ngôn ngữ khác nhau và nhiều nhiệm vụ khác nhau cùng một lúc, cho phép nó phát triển sự hiểu biết toàn diện hơn về thông tin và kiến ​​thức thế giới so với các mô hình trước đó. Và MUM là đa phương thức, nghĩa là nó không chỉ hiểu thông tin trên văn bản mà cả trên hình ảnh; và trong tương lai, có thể mở rộng sang nhiều phương thức hơn như video và âm thanh.

Pandu Nayak. Nguồn: Trang thông tin của ông.

Trở lại câu hỏi về việc leo núi Phú Sĩ: MUM có thể hiểu rằng bạn đang so sánh hai ngọn núi, vì vậy thông tin về độ cao và đường mòn có thể có liên quan. Nó cũng có thể hiểu rằng, trong bối cảnh leo núi, để "chuẩn bị" có thể bao gồm những thứ như rèn luyện thể lực hay tìm kiếm thiết bị phù hợp.


Vì MUM có thể đưa ra những thông tin chi tiết dựa trên kiến ​​thức sâu rộng của mình về thế giới, nên nó có thể nhấn mạnh rằng mặc dù cả hai ngọn núi có độ cao tương đương, nhưng mùa thu là mùa mưa trên núi Phú Sĩ, vì vậy bạn có thể cần một chiếc áo khoác chống thấm nước. MUM cũng có thể hiển thị các chủ đề phụ hữu ích để khám phá sâu hơn - như Top các thiết bị leo núi hoặc Top các bài tập huấn luyện tốt nhất - bằng cách gợi ý đến các bài báo, video và hình ảnh hữu ích từ khắp nơi trên web.

Xóa bỏ rào cản ngôn ngữ

Ngôn ngữ có thể là một rào cản đáng kể trong việc tiếp cận thông tin. MUM sẽ phá vỡ những ranh giới này bằng cách chuyển giao kiến ​​thức qua các ngôn ngữ. Nó có thể học từ các nguồn không được viết bằng ngôn ngữ bạn đã viết tìm kiếm và giúp mang thông tin đó đến cho bạn.

Giả sử có thông tin thực sự hữu ích về núi Phú Sĩ được viết bằng tiếng Nhật; hiện nay, bạn không tìm thấy nó nếu bạn không tìm kiếm bằng tiếng Nhật. Nhưng MUM có thể chuyển kiến ​​thức từ các nguồn qua các ngôn ngữ và sử dụng những thông tin chi tiết đó để đưa ra kết quả phù hợp nhất bằng ngôn ngữ ưa thích của bạn. Vì vậy, trong tương lai, khi bạn đang tìm kiếm thông tin về việc tham quan Núi Phú Sĩ, bạn có thể thấy các kết quả như nơi ngắm cảnh đẹp nhất của núi, suối nước nóng trong khu vực và các cửa hàng lưu niệm nổi tiếng - những thông tin mà hiện giờ chỉ được tìm thấy khi tìm kiếm trong Tiếng Nhật.


Hiểu thông tin từ các dạng thức khác nhau

MUM là đa phương thức, có nghĩa là nó có thể hiểu đồng thời thông tin từ các định dạng khác nhau như trang web, hình ảnh và hơn thế nữa. Ví dụ, bạn có thể chụp ảnh đôi ủng dã ngoại của mình và hỏi, "Tôi có thể sử dụng chúng để leo núi Phú Sĩ không?" MUM sẽ hiểu hình ảnh và kết nối nó với câu hỏi của bạn để cho bạn biết rằng đôi ủng của bạn sẽ hoạt động tốt. Sau đó, nó có thể hướng bạn đến một blog với danh sách các thiết bị được đề xuất.


Áp dụng AI nâng cao vào Tìm kiếm một cách có trách nhiệm

Bất cứ khi nào chúng tôi thực hiện một bước nhảy vọt với AI để làm cho thông tin của thế giới dễ tiếp cận hơn, chúng tôi đều làm điều đó một cách có trách nhiệm. Mọi cải tiến đối với Google Tìm kiếm đều trải qua một quy trình đánh giá nghiêm ngặt để đảm bảo chúng tôi đang cung cấp các kết quả hữu ích, phù hợp hơn. Người đánh giá nhân lực, những người tuân theo Nguyên tắc đánh giá chất lượng tìm kiếm của chúng tôi, giúp chúng tôi hiểu kết quả của chúng tôi giúp mọi người tìm kiếm thông tin tốt như thế nào.

Cũng giống như chúng tôi đã thử nghiệm cẩn thận nhiều ứng dụng của BERT được khởi chạy từ năm 2019, MUM sẽ trải qua quá trình tương tự như khi chúng tôi áp dụng các mô hình này trong Tìm kiếm. Cụ thể, chúng tôi sẽ tìm kiếm các mẫu có thể tạo ra sự thiên vị trong học máy để tránh đưa sự sai lệch vào hệ thống của chúng tôi. Chúng tôi cũng sẽ áp dụng các bài học từ nghiên cứu mới nhất của mình về cách giảm lượng khí thải carbon của các hệ thống đào tạo như MUM, để đảm bảo Tìm kiếm tiếp tục chạy hiệu quả nhất.

Chúng tôi sẽ mang đến các tính năng và cải tiến do MUM hỗ trợ cho các sản phẩm của mình trong những tháng và năm tới. Mặc dù chúng ta đang trong những ngày đầu khám phá MUM, nhưng đó là một cột mốc quan trọng hướng tới một tương lai nơi Google có thể hiểu tất cả các cách khác nhau mà mọi người giao tiếp và diễn giải thông tin một cách tự nhiên.

Phạm Hoài Nhân
Biên dịch từ bài viết MUM: A new AI milestone for understanding information
của Pandu Nayak, Thành viên và Phó chủ tịch Google Tìm kiếm.

(1) T5: Còn gọi là Google T5 (Text-To-Text Transform Transformer, Bộ chuyển đổi dùng để chuyển Văn bản thành Văn bản) là một mô hình NLP (Neuro-linguistic programming, Lập trình ngôn ngữ tư duy) được Google đưa ra từ năm ngoái trong đó đầu vào và đầu ra luôn là chuỗi văn bản - được các tác vụ NLP sắp xếp lại thành một định dạng thống nhất.

(2) BERT: viết tắt của Bidirectional Encoder Representations from Transformers một nghiên cứu mới mang tính đột phá của Google trong lĩnh vực xử lý ngôn ngữ tự nhiên, được công bố cuối năm 2018.

Không có nhận xét nào:

Đăng nhận xét