Nhưng... Generative AI là cái quái gì?
Nghĩa đen của Generative là sinh sản. Generative AI là AI sinh sản hay AI sáng tạo. Nhưng chỉ dịch như vậy thì... cũng đâu hiểu được nó là cái gì. Chắc là biết vậy nên Google mới bày ra một cuộc trò chuyện với Douglas Eck, giám đốc nghiên cứu cấp cao của Google, để ông này giải thích cho mọi người rõ hơn. Tui chỉ làm trò tài khôn là dịch lại nội dung trò chuyện này thôi.
Hỏi chuyện chuyên gia: Generative AI là gì?
Eben Carle
Keyword Contributor
Gần đây, Google đã mở rộng quyền truy cập vào Bard, một thử nghiệm ban đầu cho phép bạn làm việc với AI sáng tạo (generative AI). Bard được hỗ trợ bởi một mô hình ngôn ngữ lớn, đây là một loại mô hình học máy đã trở nên nổi tiếng với khả năng tạo ra ngôn ngữ với giọng nói tự nhiên. Đó là lý do tại sao bạn thường nghe nó được gọi là “AI sáng tạo”. Như với bất kỳ công nghệ mới nào, việc mọi người có nhiều thắc mắc là điều bình thường — chẳng hạn như AI sáng tạo chính xác là gì.
Để trao đổi những câu hỏi thường gặp về AI sáng tạo, mô hình ngôn ngữ lớn, máy học, v.v., mời bạn trò chuyện với Douglas Eck, giám đốc nghiên cứu cấp cao của Google. Doug không chỉ đi đầu trong lĩnh vực AI mà còn nghiên cứu về văn học và âm nhạc. Sự kết hợp giữa kỹ thuật và sáng tạo ấy giúp anh có một vị thế đặc biệt để giải thích cách thức hoạt động của AI sáng tạo cùng ý nghĩa của nó đối với tương lai của công nghệ và sự sáng tạo. Đây là những gì anh ấy đã nói.
Trước khi đi sâu vào AI sáng tạo, hãy nói về AI một cách chung nhất. Đó là một trong những thuật ngữ hấp dẫn nhưng khá mơ hồ. AI chính xác là gì?
AI là một thuật ngữ rộng thường được sử dụng để mô tả tất cả các loại hệ thống máy tính tiên tiến. Cụ thể hơn, đó là “học máy”. Hầu hết những gì chúng ta thấy trong AI ngày nay thực sự là học máy: cung cấp cho các hệ thống máy tính khả năng học hỏi từ các ví dụ.
Chúng tôi gọi những cỗ máy được lập trình để học hỏi từ các ví dụ là “mạng lưới thần kinh”. Một cách chính để các cỗ máy này học là cung cấp cho chúng nhiều ví dụ, chẳng hạn như được cho biết nội dung trong một hình ảnh — chúng tôi gọi đây là phân loại. Nếu muốn dạy một mạng cách nhận biết một con voi, người ta sẽ giới thiệu cho nó rất nhiều ví dụ về hình dáng của một con voi và gắn thẻ những bức ảnh đó cho phù hợp. Đó là cách mô hình học cách phân biệt giữa một con voi và các thứ khác trong ảnh.
Các mô hình ngôn ngữ là một loại mạng lưới thần kinh khác.
Các mô hình ngôn ngữ hoạt động như thế nào?
Về cơ bản, các mô hình ngôn ngữ dự đoán từ nào tiếp theo trong một chuỗi từ. Chúng tôi đào tạo các mô hình này trên khối lượng lớn văn bản để chúng hiểu rõ hơn từ nào có khả năng xuất hiện tiếp theo. Một cách - nhưng không phải là cách duy nhất - để cải thiện một mô hình ngôn ngữ là cho nó “đọc” nhiều hơn - hoặc đào tạo nó trên nhiều dữ liệu hơn - giống như cách chúng ta học từ các tài liệu mà chúng ta nghiên cứu. Nếu bạn bắt đầu nhập cụm từ, “Mary đá một…”, thì một mô hình ngôn ngữ được đào tạo dựa trên đủ dữ liệu có thể dự đoán, “Mary đá một quả bóng”. Nếu không được đào tạo đầy đủ, nó có thể chỉ nghĩ tới một “vật thể tròn” hoặc chỉ có màu vàng. Càng nhiều dữ liệu liên quan đến việc đào tạo mô hình ngôn ngữ, nó càng trở nên đa sắc thái hơn và càng có cơ hội hiểu rõ hơn để biết chính xác những gì Mary có khả năng đã đá nhất.
Trong vài năm qua, đã có những bước đột phá lớn về cách chúng tôi đạt được hiệu suất tốt hơn trong các mô hình ngôn ngữ, từ việc điều chỉnh kích thước của chúng cho đến giảm lượng dữ liệu cần thiết cho một số tác vụ nhất định.
Các mô hình ngôn ngữ như thế hiện đã sẵn có để giúp mọi người — chẳng hạn như bạn thấy chúng xuất hiện với Soạn thư thông minh và Trả lời thông minh trong Gmail (bạn gõ một số từ và Gmail dự đoán các từ kế tiếp). Bard cũng được các mô hình ngôn ngữ cung cấp năng lưc như vậy.
Hiểu rồi. Vậy là ta đã giải thích về các mô hình ngôn ngữ và AI. Còn AI sáng tạo thì sao?
Một mô hình sáng tạo có thể lấy những gì nó đã học được từ các ví dụ được trao cho nó và tạo ra một cái gì đó hoàn toàn mới dựa trên thông tin đó. Do đó mới có từ generative (sinh sản)! Các mô hình ngôn ngữ lớn (LLM) là một loại AI sáng tạo vì chúng tạo ra các tổ hợp văn bản mới ở dạng ngôn ngữ có âm thanh tự nhiên. Và chúng tôi thậm chí có thể xây dựng các mô hình ngôn ngữ để tạo ra các loại đầu ra khác, chẳng hạn như hình ảnh mới, âm thanh và thậm chí cả video, như với các ứng dụng Imagen, AudioLM và Phenaki.
Điều này đặt ra một câu hỏi lớn cho nhiều người: Generative AI có ý nghĩa gì đối với các lĩnh vực sáng tạo và sáng tạo nói chung?
Tôi nghĩ rằng lĩnh vực sáng tạo có tiềm năng rất lớn - hãy nghĩ về nó như là loại bỏ một số công việc cực nhọc lặp đi lặp lại các nhiệm vụ đơn thuần như tạo bản nháp chứ không xâm phạm khả năng sáng tạo bẩm sinh của con người. Là một nhà nghiên cứu âm nhạc, tôi nghĩ về AI sáng tạo giống như cách người ta nghĩ về sự xuất hiện của máy đánh trống từ nhiều thập kỷ trước. Máy đánh trống tạo ra một nhịp điệu khác với âm thanh của những người đánh trống và điều đó đã thúc đẩy các thể loại âm nhạc hoàn toàn mới.
Giống như rất nhiều âm nhạc từ những năm 1980?
Chắc chắn rồi, hãy xem hip-hop đã phát triển như thế nào ở Bronx với việc sử dụng máy đánh trống. Toàn bộ thể loại đó đã được nâng cao nhờ sự phát triển công nghệ phụ trợ mới này trong âm nhạc. Máy đánh trống không thay thế tay trống, nó chỉ thêm một tầng khác.
Rõ rồi, đấy là những cơ hội. Nhưng còn những thách thức tiềm tàng thì sao?
Tôi đã nuôi dạy hai đứa con và lấy bằng văn học trước khi theo học ngành khoa học máy tính, vì vậy tôi đang tự đặt cho mình những câu hỏi thực sự về cách các nhà giáo dục đo lường sự thành công trong một thế giới nơi mà AI sáng tạo có thể viết một bài luận khá hay cho học sinh lớp 8 hoặc lớp 9.
Nếu bạn nghĩ lại, khi máy tính vẽ đồ thị xuất hiện, làm thế nào giáo viên có thể biết liệu học sinh của họ có tự làm toán hay không? Giáo dục tiến bộ bằng cách hiểu học sinh có những công cụ nào và yêu cầu học sinh “thể hiện công việc của mình” theo những cách mới.
Các công ty — bao gồm cả công ty của chúng tôi — có trách nhiệm suy nghĩ xem những mô hình này sẽ phù hợp với mục đích gì và làm thế nào để đảm bảo đây là một sự phát triển chứ không phải là một sự phá hoại.
Tôi rất vui vì anh đã đưa ra vấn đề trách nhiệm. Anh có thể nói về cách Google tiếp cận việc phát triển máy học không?
Chúng tôi đã và đang dành thời gian để làm điều này một cách chu đáo. Khi xây dựng một sản phẩm, chúng tôi muốn tin rằng nó hữu ích và tránh gây hại. Vào năm 2018, Google là một trong những công ty đầu tiên phát triển và công bố Nguyên tắc AI, đồng thời đưa ra cơ cấu quản trị nội bộ để tuân theo các nguyên tắc đó. Công trình về AI của Google hiện nay có sự tham gia của nhóm AI có trách nhiệm và nhiều nhóm khác tập trung vào việc tránh thiên vị, độc hại và các tác hại khác trong khi phát triển các công nghệ mới.
Anh đã kể ra những điều nhỏ và hữu ích mà những bước nhảy vọt kỹ thuật lớn này mang tới. Nhưng AI có thể tạo ra bước nhảy vọt lớn như thế nào đối với xã hội?
Bây giờ chúng ta biết rằng máy móc có thể giải quyết các vấn đề đơn giản như phân loại hình ảnh và tạo tài liệu. Nhưng tôi nghĩ chúng ta đã sẵn sàng cho những khả năng thậm chí còn tham vọng hơn, chẳng hạn như giải quyết vấn đề bằng lý luận phức tạp. Ngày nay, AI sáng tạo có thể giúp bạn viết một mẫu thư. Ngày mai, nó có thể xem xét lại các quy trình và phương thức sáng tạo của bạn để giải phóng bạn khỏi những việc vụn vặt và giải quyết những thách thức hoàn toàn mới với một tâm thế mới. Thông qua cộng tác và thử nghiệm theo thời gian, chúng tôi sẽ khám phá ra nhiều lợi ích hơn nữa từ AI tổng hợp.
Phạm Hoài Nhân (dịch và biên tập)
Không có nhận xét nào:
Đăng nhận xét