Pages

Thứ Bảy, 29 tháng 3, 2025

Chỉ mất 5 phút để anh em phân biệt giữa mô hình ngôn ngữ lớn với AI suy luận

Vào tháng 9, OpenAI đã giới thiệu một phiên bản ChatGPT mới, được thiết kế để suy luận qua các nhiệm vụ liên quan đến toán học, khoa học và lập trình máy tính. Không giống như các phiên bản chatbot trước đây, công nghệ mới này có thể dành thời gian "suy nghĩ" về các vấn đề phức tạp trước khi đưa ra câu trả lời.

Gần như ngay lập tức, OpenAI cho biết công nghệ suy luận mới của họ đã vượt trội hơn so với các hệ thống hàng đầu trong ngành trên một loạt các bài kiểm tra theo dõi sự tiến bộ của trí tuệ nhân tạo. Hiện tại, các công ty khác như Google, Anthropic và DeepSeek của Trung Quốc cũng đang cung cấp các công nghệ tương tự.

Nhưng liệu AI thực sự có thể suy luận giống con người hay không? Điều gì cho phép định nghĩa một hệ thống máy tính "biết suy nghĩ"? Và liệu những hệ thống này có thực sự đang tiến gần đến trí thông minh nhân tạo phổ quát đích thực hay không?

Dưới đây là tất cả những gì anh em cần biết để phân biệt giữa mô hình suy luận (reasoning model) và mô hình ngôn ngữ lớn (large language model - LLM), theo cách ngắn gọn nhất có thể.

AI-Reasoning-Roughs-Lede-Final2.webp


Câu hỏi số 1: Suy luận của mô hình AI có ý nghĩa gì?

Khái niệm "suy luận" ở đây rất đơn giản. Nó chỉ có nghĩa là chatbot dành thêm thời gian để xử lý một vấn đề.

"Suy luận xảy ra khi hệ thống thực hiện công việc bổ sung sau khi câu hỏi được đặt ra," Dan Klein, giáo sư khoa học máy tính tại Đại học Berkeley, California, kiêm giám đốc công nghệ của Scaled Cognition, một startup AI, cho biết.

Hệ thống có thể chia nhỏ vấn đề thành các bước riêng lẻ hoặc cố gắng giải quyết nó thông qua quá trình thử - sai lặp đi lặp lại.

ChatGPT ban đầu trả lời câu hỏi ngay lập tức, dựa trên những phiên bản LLM GPT của OpenAI. Còn các hệ thống suy luận mới có thể làm việc với một vấn đề trong vài giây, thậm chí vài phút, trước khi đưa ra câu trả lời nhờ việc kết hợp chung với mô hình ngôn ngữ lớn.

Câu hỏi số 2: Cụ thể hơn là như thế nào?

Trong một số trường hợp, một hệ thống chatbot ứng dụng mô hình suy luận sẽ tinh chỉnh cách tiếp cận của mình đối với một câu hỏi, lặp đi lặp lại để cải thiện phương pháp đã chọn. Đôi khi, nó có thể thử nhiều cách khác nhau để giải quyết một vấn đề trước khi chọn một trong số đó. Hoặc nó có thể quay lại và kiểm tra một số công việc mà nó đã thực hiện vài giây trước, chỉ để xem liệu nó có chính xác hay không.

Về cơ bản, hệ thống sẽ cố gắng mọi thứ có thể để trả lời câu hỏi của anh em. Điều này tương tự như một học sinh tiểu học đang vật lộn tìm cách giải một bài toán khó, viết ra nhiều lựa chọn khác nhau lên giấy.

Quảng cáo



Câu hỏi số 3: Loại câu hỏi nào đòi hỏi hệ thống AI phải suy luận?

Nó có thể suy luận về bất cứ điều gì. Nhưng suy luận hiệu quả nhất khi anh em đặt câu hỏi liên quan đến toán học, khoa học và lập trình máy tính.

071324-ai-feat.webp

Câu hỏi số 4: Giờ con người vẫn thông minh hơn AI chứ?

Một số chuyên gia dự đoán rằng, AI sẽ vượt qua trí thông minh của con người trong vài năm tới. Nhưng đó là dự đoán chưa trở thành hiện thực. Còn bây giờ, anh em có thể thử sức với những câu đố trong link dưới đây, để xem các cỗ máy còn phải tiến bộ bao xa. Đây là những bài thử nghiệm thử thách khả năng nhận diện mẫu cũng như tư duy suy luận, một dạng "phép thử Turing" để phân biệt não bộ con người và máy móc điện toán:

Will A.I. Soon Outsmart Humans? Play This Puzzle to Find Out. - The New York Times

Quảng cáo



Câu hỏi số 5: Hệ thống chatbot suy luận khác với các chatbot thế hệ cũ như thế nào?

Anh em có thể yêu cầu các chatbot cũ hơn cho bạn thấy cách họ đã đạt được một câu trả lời cụ thể hoặc kiểm tra công việc của chính họ. Vì mô hình công nghệ vận hành ChatGPT ban đầu học từ văn bản thu thập trên internet, nơi mọi người trình bày cách họ đạt được câu trả lời hoặc kiểm tra công việc của mình, nên mô hình ngôn ngữ lớn cũng có thể thực hiện bước "tự phê bình" quy trình tìm ra câu trả lời.

Nhưng hệ thống suy luận đi xa hơn. Nó có thể làm những điều này mà không cần được người dùng gõ prompt yêu cầu. Và AI suy luận có thể làm chúng theo những cách ứng dụng ngữ cảnh rộng hơn, và phức tạp hơn.

Các công ty gọi đây là một hệ thống suy luận vì nó cảm thấy như nó hoạt động giống như một người đang suy nghĩ về một vấn đề khó khăn, cần chia nhỏ thành nhiều bước.

Câu hỏi số 6: Tại sao suy luận AI lại quan trọng vào lúc này?

OpenAI và các công ty khác tin rằng đây là cách tốt nhất để cải thiện chatbot AI của họ.

Trong nhiều năm, hầu hết mọi startup và tập đoàn công nghệ nghiên cứu và vận hành AI đều dựa trên một khái niệm đơn giản: Càng bơm nhiều dữ liệu internet vào chatbot của họ, hệ thống đó càng hoạt động tốt hơn.

Nhưng vào năm 2024, họ đã sử dụng gần như tất cả văn bản trên internet. Cuộc khủng hoảng về dữ liệu huấn luyện LLM bắt đầu diễn ra.

Điều đó có nghĩa là họ cần một cách mới để cải thiện chatbot của mình. Vì vậy, họ bắt đầu xây dựng các hệ thống có khả năng bắt chước cách con người suy luận.

AI-reasoning.webp

Câu hỏi số 7: Làm thế nào để xây dựng một hệ thống suy luận?

Năm ngoái, các công ty như OpenAI bắt đầu tận dụng nhiều hơn một kỹ thuật gọi là huấn luyện tăng cường (reinforcement learning).

Thông qua quá trình này, đôi khi có thể kéo dài hàng tháng, một hệ thống AI có thể học hành vi thông qua thử và sai rộng rãi. Bằng cách làm việc với hàng nghìn bài toán, ví dụ, nó có thể học được phương pháp nào dẫn đến câu trả lời đúng và phương pháp nào không.

Các nhà nghiên cứu đã thiết kế các cơ chế phản hồi phức tạp, để xác thực khi hệ thống thực hiện điều gì đó đúng và khi nó thực hiện điều gì đó sai.

"Nó hơi giống việc con người huấn luyện một con chó," Jerry Tworek, một nhà nghiên cứu tại OpenAI nói. "Nếu hệ thống làm tốt, bạn thưởng cho 'nó' một chiếc bánh quy. Nếu nó không làm tốt, bạn nói, 'Chó hư.'"

Câu hỏi số 8: Liệu học tăng cường có hiệu quả 100% không?

Nó hoạt động khá tốt trong một số lĩnh vực nhất định, như toán học, khoa học và lập trình máy tính. Đây là những lĩnh vực mà các công ty có thể xác định rõ ràng hành vi tốt và hành vi xấu. Bài toán toán học luôn luôn có những kết quả đúng hoặc sai, không có nửa đúng nửa sai.

Quy trình học tăng cường không vận hành tốt nếu dùng chatbot AI và mô hình ứng dụng vào các lĩnh vực như viết sáng tạo, triết học và đạo đức, nơi sự khác biệt giữa tốt và xấu khó xác định một cách rạch ròi hơn. Các nhà nghiên cứu cho biết, quá trình này thường có thể cải thiện hiệu suất của hệ thống AI, ngay cả khi nó trả lời các câu hỏi bên ngoài toán học và khoa học.

"Nó dần dần học được những mô hình suy luận nào dẫn nó đi đúng hướng và những mô hình nào không," Jared Kaplan, giám đốc khoa học tại Anthropic nói.

humanai-shutterstock-2253487389.webp

Câu hỏi số 9: Học tăng cường và hệ thống suy luận có giống nhau không?

Không. Học tăng cường là phương pháp mà các công ty sử dụng để xây dựng hệ thống suy luận. Đó là giai đoạn huấn luyện cuối cùng cho phép tạo ra những mô hình phục vụ chatbot suy luận.

Câu hỏi số 10: Những hệ thống suy luận này vẫn mắc lỗi chứ?

Chắc chắn rồi. Mọi thứ một chatbot làm đều dựa trên xác suất tạo sinh và nội suy văn bản và ngôn ngữ tự nhiên. Nó chọn ra một con đường giống nhất với dữ liệu mà nó học được, bất chấp việc dữ liệu đó đến từ internet hay được tạo ra thông qua học tăng cường. Đôi khi, nó chọn một tùy chọn sai hoặc không có ý nghĩa. Đấy cũng là thứ chúng ta hay gọi là AI bị "loạn ngôn" và "ảo giác".

Câu hỏi số 11: AI suy luận có phải là con đường dẫn đến một cỗ máy sánh ngang trí thông minh của con người?

Các chuyên gia AI có những quan điểm trái chiều, rất nhiều tranh cãi khi tìm ra câu trả lời cho câu hỏi này. Những phương pháp huấn luyện để tạo ra những AI biết suy luận vẫn còn tương đối mới và các nhà nghiên cứu vẫn đang cố gắng hiểu giới hạn của chúng. Trong lĩnh vực AI, các phương pháp mới thường tiến triển rất nhanh lúc đầu, trước khi có sự chững lại về tốc độ cải tiến công nghệ.

Theo The New York Times

Khóa học Machine Learning cơ bản- Khoa học dữ liệu - AI
==***==

Khoá học Quản trị Chiến lược Dành cho Lãnh đạo Doanh nghiệp

Nhấn vào đây để bắt đầu khóa học

==***==
Nơi hội tụ Tinh Hoa Tri Thức - Khơi nguồn Sáng tạo
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com
--- 

Khóa học Hacker và Marketing từ A-Z trên ZALO!

Khóa học Hacker và Marketing từ A-Z trên Facebook!

Khóa đào tạo Power BI phân tích báo cáo để bán hàng thành công

Bảo mật và tấn công Website - Hacker mũ trắng
Hacker mũ trắng
KHÓA HỌC LẬP TRÌNH PYTHON TỪ CƠ BẢN ĐẾN CHUYÊN NGHIỆP

Khóa học Lập trình Visual Foxpro 9 - Dành cho nhà quản lý và kế toán

Khóa học hướng dẫn về Moodle chuyên nghiệp và hay
Xây dựng hệ thống đào tạo trực tuyến chuyên nghiệp tốt nhất hiện nay.



Khóa học AutoIt dành cho dân IT và Marketing chuyên nghiệp

Khoá học Word từ cơ bản tới nâng cao, học nhanh, hiểu sâu


Khóa học hướng dẫn sử dụng Powerpoint từ đơn giản đến phức tạp HIỆU QUẢ
Khóa học Thiết kế, quản lý dữ liệu dự án chuyên nghiệp cho doanh nghiệp bằng Bizagi
Khoa hoc hay
Khóa học Phân tích dữ liệu sử dụng Power Query trong Excel

Khóa học Lập trình WEB bằng PHP từ cơ bản đến nâng cao

Khóa học Phân tích dữ liệu sử dụng TableAU - Chìa khóa thành công!
Nhấn vào đây để bắt đầu khóa học


Khóa học Phân tích dữ liệu sử dụng SPSS - Chìa khóa thành công!


Khóa học "Thiết kế bài giảng điện tử", Video, hoạt hình 
kiếm tiền Youtube bằng phần mềm Camtasia Studio
Khóa học HƯỚNG DẪN THIẾT KẾ VIDEO CLIP CHO DÂN MARKETING CHUYÊN NGHIỆP
Xây dựng website​​​​
HƯỚNG DẪN THIẾT KẾ QUẢNG CÁO VÀ ĐỒ HỌA CHUYÊN NGHIỆP VỚI CANVA
Hãy tham gia khóa học để trở thành người chuyên nghiệp. Tuyệt HAY!😲👍
Khoa hoc hay
MICROSOFT ACCESS



GOOGLE SPREADSHEETS phê không tưởng
Khoa hoc hay
Khóa hoc lập trình bằng Python tại đây

Hãy tham gia khóa học để biết mọi thứ

Để tham gia tất cả các bài học, Bạn nhấn vào đây 

Khóa học lập trình cho bé MSWLogo
Nhấn vào đây để bắt đầu học
Nhấn vào đây để bắt đầu học


Khóa học Ba, Mẹ và Bé - Cùng bé lập trình  TUYỆT VỜI

Khoa hoc hay

Khóa học sử dụng Adobe Presenter-Tạo bài giảng điện tử
Khoa hoc hay
Design Website

Để thành thạo Wordpress bạn hãy tham gia khóa học 
Khóa học sử dụng Edmodo để dạy và học hiện đại để thành công
==***==
Bảo hiểm nhân thọ - Bảo vệ người trụ cột
Cập nhật công nghệ từ Youtube tại link: congnghe.hocviendaotao.com
Tham gia nhóm Facebook
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com

Nguồn: Tinh Tế