Kho tri thức khổng lồ và khả năng ‘học nói’ của ChatGPT

“Sự thông minh” vượt trội của ChatGPT từ khi ra mắt vào tháng 11.2022 đã lập tức tạo cơn bão dư luận với nhiều cách tiếp cận khác nhau về tương lai của trí tuệ nhân tạo (AI).

Người Đô Thị đã trao đổi với PGS-TS. Đinh Điền (Giám đốc Trung tâm Ngôn ngữ học tính toán, Trường Đại học Khoa học Tự nhiên TP.HCM), về sự có mặt của ChatGPT, một chatbot hoàn toàn khác với phương thức tương tác trước đây giữa máy và con người.

Bước đột phá không chỉ là công nghệ lập trình AI

Ông có thể cho biết công cụ đang gây chú ý cho nhân loại đặt nền tảng trên những công nghệ nào thuộc AI?

ChatGPT của OpenAI là sự kết hợp nhiều công nghệ của AI. Trong đó, sử dụng công nghệ chính là máy học sâu (deep learning) trên kho dữ liệu cực lớn. Bigdata này chứa đến 300 tỷ từ, 175 tỷ tham số. Với khối lượng khổng lồ như vậy, hiện trên thế giới chỉ có vài công ty có khả năng xử lý được. Sở dĩ khẳng định như vậy là vì để thao tác trên hàng tỷ tham số, khi tổ hợp lên hàng tỷ tỷ trường hợp, thì công suất CPU, bộ nhớ phải cực khủng. Với các máy tính mạnh nhất mà chúng ta đang có, phải mất đến mấy trăm năm cũng không chạy xong một truy vấn.

PGS-TS. Đinh Điền. Ảnh: Quốc Ngọc


Nhờ vào khối lượng tính toán quá lớn như vậy, ChatGPT nắm gần như toàn bộ các vấn đề về từ ngữ, cấu trúc của các ngôn ngữ. Khi chúng ta đưa câu hỏi, “con AI” trả lời giống như người với độ trơn tru đáng kinh ngạc bởi nó đã được học cả hàng triệu triệu văn bản của con người.

Sản phẩm của OpenAI cho kết quả tốt là vì họ đã đầu tư xây dựng kho dữ liệu huấn luyện rất kỹ chứ không đơn thuần thu thập tất cả văn bản khắp thế giới. Họ phải thuê người ngồi chú thích, dán nhãn, với câu hỏi đó thì trả lời thế nào, có bao nhiêu cách trả lời, cách trả lời nào tốt hơn… Rồi khi máy thực thi, người dùng lại đánh giá đúng hay sai để máy “rút kinh nghiệm”. Quá trình như vậy lập đi lập lại khiến cho độ chính xác càng ngày càng cao.

Thực chất, chatbot này vẫn nhằm giải quyết bài toán truy xuất thông tin. Công cụ tìm kiếm (search engine) như Google chẳng hạn, đưa ra các kết quả theo từ khóa tìm kiếm. Nhưng ChatGPT đi xa hơn là không chỉ tìm kiếm thông tin mà còn đưa ra các gợi ý suy luận, thậm chí xác quyết một số vấn đề trong lĩnh vực khoa học tự nhiên lẫn xã hội. Ông có thể cho biết khái lược về nền tảng học thuật của sản phẩm?

Phải nói là một cuộc cách mạng. Trước đây, khi chúng ta đưa từ khóa vào tìm kiếm trên Google, máy sẽ truy ra hàng trăm, hàng ngàn kết quả. Các kết quả đó được Google xếp hạng, đánh giá, gợi ý cái nào gần với câu hỏi, yêu cầu của người dùng nhất. Chúng ta lần lượt đọc từng kết quả đó để có thể rút ra thông tin chính mà mình cần.

Trong khi đó, ChatGPT đóng vai trò như người tổng hợp hàng trăm, hàng ngàn thông tin kết quả đó và đúc kết thành báo cáo hoàn chỉnh. Thay vì phải đọc hàng trăm, hàng ngàn tài liệu thì giờ đây đã có “người” tổng hợp sẵn cho ta rồi.

Về nền tảng học thuật của sản phẩm, trong AI có một hướng hẹp hơn là xử lý ngôn ngữ tự nhiên (natural language processing). Các bước xử lý ngôn ngữ tự nhiên là gì? Thí dụ ta đưa vào câu “Con mèo vồ con chuột”. Phân tích đầu tiên “con mèo” là danh từ, “vồ” là động từ, “con chuột” là danh từ. Phân tích cao hơn về mặt cú pháp thì “con mèo” là chủ ngữ, “con chuột” là tân ngữ, “vồ” là động từ. Cao hơn nữa về mặt ngữ nghĩa thì chủ thể hành động là mèo, đối thể là chuột. Xa hơn nữa về ngữ dụng ta có thể suy đoán với động từ “vồ” thì con chuột phải rất sợ…

Đó là những bước phân tích trong xử lý ngôn ngữ tự nhiên. Sau khi phân tích câu nguồn, ChatGPT sẽ tìm câu trả lời phù hợp. Và để làm ra câu trả lời mỹ mãn thì tất cả dựa trên công nghệ máy học sâu.

OpenAI chưa cung cấp dịch vụ tại Việt Nam, vì thế việc sử dụng các tài khoản dùng chung hiện nay là điều đáng lo ngại. Ảnh: TLTG


Tôi minh họa đơn giản thế này để hiểu về máy học: Ta giao cho chatbot 100 bài toán yêu cầu tìm lời giải. 100 bài đó có đáp án do con người đưa ra. Trong trường hợp chatbot giải bằng phương pháp A ra kết quả đúng, phương pháp B ra kết quả sai, phương pháp C ra kết quả đúng… thì lần sau nó sẽ nhớ với các bài toán dạng này thì phải dùng phương pháp A và C, gọi là máy học.

Trong xử lý ngôn ngữ tự nhiên, có lẽ mức cao nhất cuối cùng là ngữ dụng, liệu AI có thể đạt được đến mức phân tích này không?

À, máy hiện đang thua chúng ta về khía cạnh này. Bởi ngữ dụng phụ thuộc vào các hàm ý trong câu nói. Tôi nói: “Trời tối rồi”! Về mặt ngữ pháp, mình biết “trời” là chủ ngữ, “tối rồi” là vị ngữ. Về mặt ngữ nghĩa, mình biết là mặt trời lặn rồi, chiều rồi. Tuy nhiên, về mặt ngữ dụng thì câu đó có thể được dùng vào nhiều mục đích phong phú.

Ví dụ, anh rủ tôi đi uống cà phê, tôi có thể từ chối bằng cách trả lời: “Trời tối rồi”. Hoặc ở nhà mà đến 6 giờ chiều thấy quần áo phơi thì khi nghe người cha nói “Trời tối rồi”, người con phải biết đó là mệnh lệnh mang quần áo vào.

Học lại cách đặt câu hỏi

Nhưng có ý kiến cho rằng máy học chỉ là một hình thức thu thập thông tin theo tình huống? Và trường hợp nào thì việc học này của máy thúc đẩy quá trình hoàn thiện, còn trường hợp nào khiến việc học của máy mất kiểm soát và sai lệch so với chuẩn tri thức chung, thưa ông?

Trong quá trình hoạt động chatbot vẫn có yếu tố gây nhiễu. Giả sử có 1.000 câu thì có thể 900 câu cho ra kết quả dương, còn lại ra kết quả âm. Tức là vẫn có những câu sai nhưng thường tỷ lệ sẽ thấp hơn.

Do đó, khi cho chế độ người dùng tự hiệu chỉnh, nhận xét, thật ra ChatGPT cũng không dám để cho con người tác động vô nó hoàn toàn mà sẽ có bước tự kiểm tra lại. Ví dụ, cùng một kết quả dịch, nhưng có đến ba người cho ba bản dịch khác nhau. Như vậy là có vấn đề, máy sẽ học để hoàn thiện đáp án của mình. Còn nếu ba người cho cùng kết quả thì độ tin cậy đã cao hơn.

Nhiều người Việt đang dùng ChatGPT với tính cách giải trí, tò mò chứ chưa nhằm phục vụ công việc hay nghiên cứu. Ông có thể gợi ý cách sử dụng ChatGPT như một công cụ nâng cao tri thức cho con người một cách đúng đắn và hiệu quả nhất? 

Một số đồng nghiệp của tôi sử dụng nghiêm túc ChatGPT để hỗ trợ việc giảng dạy tiếng Anh. Theo tôi, chúng ta nên tìm hiểu một cách bài bản trước khi sử dụng và ứng dụng vào thực tế đối với lĩnh vực chuyên môn của mình. Nếu chỉ chat chơi chơi thôi thì chắc chắn chatbot này cũng không mang lại hiệu quả gì. Và cho dù làm ngành nghề nào đi nữa, điều quan trọng hàng đầu là phải biết cách đặt câu hỏi. Câu hỏi càng chi tiết, rõ ràng, có nhiều yếu tố thì kết quả trả lời càng chính xác. Ngược lại, nếu câu hỏi chung chung, ChatGPT cũng trả lời chung chung.

Hình ảnh này được tạo ra bởi phần mềm của OpenAI, với chú thích trong phòng làm việc của những công nhân ở châu Phi làm cho OpenAI. Ảnh: TIME


Dự phóng về tương lai với AI, ngoài việc cung cấp công cụ hỗ trợ tốt nhất cho con người ở mọi lĩnh vực, theo ông nó sẽ tác động thay đổi nền tảng xã hội như thế nào về vấn đề đạo đức, quan hệ xã hội, tôn giáo…?

Tôi cho rằng AI sẽ ảnh hưởng rất nhiều tới xã hội với mọi khía cạnh tốt xấu. Riêng với ChatGPT, phải nói AI như là trợ lý thực thụ và vô cùng đắc lực về mặt ngôn ngữ cho con người.

Tại sao kỳ này sản phẩm của OpenAI lại gây cú sốc lớn với toàn thế giới? Bởi ChatGPT đã tác động, ảnh hưởng đến ngôn ngữ. Mà ngôn ngữ là phương tiện giao tiếp quan trọng nhất của loài người. Bất cứ hoạt động gì, con người cũng phải dùng ngôn ngữ. Cái gì liên quan ngôn ngữ đều ảnh hưởng đến đời sống. Đó là mặt tích cực sâu rộng của chatbot này.

Về xã hội, chắc chắn làn sóng thất nghiệp sẽ gia tăng khủng khiếp. Thay vì trước đây phải tuyển 10 người biên tập nội dung quảng cáo một mặt hàng thì giờ chỉ cần một người. Bởi với cùng một câu hỏi, trong 10 lần trả lời, ChatGPT sẽ có 10 đáp án cùng nội dung nhưng khác hình thức thể hiện. Điều này giúp người biên tập có thể có 10 bài viết khác nhau cho cùng một yêu cầu.

Trước mắt, những người làm việc liên quan đến sản xuất nội dung, cả văn bản hay video đều ảnh hưởng, không chỉ quảng cáo mà cả vấn đề ngôn ngữ máy tính cũng vậy. Trước đây bạn không biết lập trình, giờ chỉ cần nói là chatbot lập trình luôn. Sắp tới làm website, viết mã (code) gì nó đều làm được. Tôi nghĩ tương lai chatbot sẽ xử lý ngôn ngữ lập trình còn tốt hơn ngôn ngữ tự nhiên vì ngôn ngữ lập trình có đặc thù logic hình thức, không bị nhập nhằng, mơ hồ.

Xin cảm ơn ông. 

Nam Anh thực hiện