Header ads

Header ads
» »

OpenAI giới thiệu GPT-5.2: câu trả lời của OpenAI cho Google Gemini 3

OpenAI đã chính thức giới thiệu GPT-5.2, mô hình ngôn ngữ lớn mới nhất được thiết kế tối ưu cho các công việc tri thức chuyên sâu, nghiên cứu khoa học và lập trình. Đây được xem là câu trả lời đanh thép của OpenAI trước sự trỗi dậy mạnh mẽ của Gemini 3 từ Google trong thời gian gần đây.

GPT-5.2 được phát hành với ba phiên bản chính: Instant (nhanh), Thinking (tập trung suy luận sâu) và Pro (phiên bản mạnh nhất).

Hiệu năng vượt trội trong công việc chuyên nghiệp (GDPval)

Workforce-Planner---desktop---light.webp
Một trong những tiêu điểm của GPT-5.2 là khả năng xử lý các tác vụ "kiếm ra tiền" (economically valuable tasks). OpenAI đã sử dụng một bộ đánh giá mới có tên là GDPval – bao gồm các đầu việc tri thức đặc thù trải dài trên 44 ngành nghề khác nhau (như tạo bảng tính tài chính phức tạp, lên kế hoạch nhân sự, soạn thảo slide thuyết trình...).

Kết quả cho thấy phiên bản GPT-5.2 Thinking đã đánh bại hoặc hòa với các chuyên gia con người trong 70.9% các trường hợp so sánh. Để dễ hình dung, phiên bản GPT-5 trước đó chỉ đạt mức 38.8%. Điều này đồng nghĩa với việc mô hình này không chỉ "chém gió" mà thực sự có thể thực hiện các công việc chuyên môn ở mức độ tin cậy cao.

"Bộ não" khoa học và toán học đạt đỉnh cao mới


Nếu anh em quan tâm đến khả năng tư duy logic của AI, thì các con số benchmark của GPT-5.2 thực sự gây choáng ngợp:

  • AIME 2025 (Thi Toán học): Đạt điểm số 100% tuyệt đối. Đây là một bước nhảy vọt, biến nó trở thành mô hình đầu tiên giải quyết trọn vẹn đề thi toán học thi đấu này mà không cần công cụ hỗ trợ.
GPQA Diamond-Science questions.png
  • GPQA Diamond (Khoa học trình độ cao học): Phiên bản GPT-5.2 Pro đạt 93.2%, vượt qua ngưỡng của các chuyên gia trong lĩnh vực Vật lý, Hóa học và Sinh học.
FrontierMath (Tier 1–3)-Advanced mathematics.png
  • FrontierMath: Đây là bộ đề toán cực khó dành cho cấp độ chuyên gia nghiên cứu. GPT-5.2 giải được 40.3% số bài toán (Tier 1-3), một con số thoạt nghe có vẻ thấp nhưng thực tế là kỷ lục mới, bỏ xa các mô hình trước đó (vốn chỉ giải được dưới 10-20%).

Đặc biệt, OpenAI đã công bố một case study cho thấy GPT-5.2 Pro đã hỗ trợ các nhà nghiên cứu giải quyết thành công một bài toán mở trong lý thuyết học thống kê (statistical learning theory), chứng minh rằng AI đã bắt đầu tham gia vào việc tạo ra tri thức khoa học mới chứ không chỉ là tổng hợp lại.

Khả năng lập trình và "Agent"

SWE-Bench Pro (public)-Software engineering.png
Về mảng code, GPT-5.2 Thinking đạt 55.6% trên bảng xếp hạng SWE-Bench Pro – một bài kiểm tra kỹ thuật phần mềm sát thực tế, đòi hỏi AI phải xử lý code trên 4 ngôn ngữ lập trình khác nhau và giải quyết vấn đề trong các kho lưu trữ (repository) lớn.

Mô hình này cũng thể hiện khả năng "Agentic" (tác vụ tự chủ) mạnh mẽ. Ví dụ, trong các tác vụ yêu cầu sử dụng công cụ (Tool calling) như Tau2-bench Telecom, nó đạt độ chính xác 98.7%. Điều này cho phép GPT-5.2 thực hiện các chuỗi công việc dài hơi như: tự động debug, refactor (tái cấu trúc) code, hoặc quản lý các quy trình chăm sóc khách hàng đa bước mà ít gặp lỗi ngớ ngẩn hơn.

Giảm ảo giác và xử lý ngữ cảnh dài

Response-level error rate on de-identified ChatGPT queries-.png
Theo báo cáo kỹ thuật, GPT-5.2 Thinking giảm được 30% tỉ lệ bịa đặt thông tin so với GPT-5.1 Thinking. Đây là cải tiến cực kỳ quan trọng cho anh em làm nghiên cứu hoặc phân tích dữ liệu cần độ chính xác cao. GPT-5.2 cũng hỗ trợ ngữ cảnh dài, lên đến 256k tokens (tương đương hàng trăm nghìn từ).
OpenAI MRCRv2, 4 needles-Long context.png
OpenAI MRCRv2, 8 needles-Long context.png

Quảng cáo


Trong bài kiểm tra MRCRv2 (tìm kiếm thông tin "kim đáy bể" trong văn bản dài), mô hình đạt độ chính xác gần như 100%, cho phép xử lý các tài liệu pháp lý hoặc báo cáo kỹ thuật dày cộp mà không bị "loạn".
CharXiv Reasoning-Scientific figure questions.png
Khả năng nhìn và hiểu hình ảnh cũng được nâng cấp mạnh. GPT-5.2 giảm một nửa tỉ lệ lỗi khi đọc biểu đồ khoa học và hiểu giao diện phần mềm. Ví dụ thực tế là anh em có thể quăng một tấm ảnh chụp màn hình dashboard phức tạp vào, và nó có thể phân tích số liệu hoặc bóc tách các thành phần giao diện (UI) chính xác hơn nhiều so với đời cũ.

Tổng kết


GPT-5.2 không chỉ là một bản cập nhật nhỏ giọt mà là một bước tiến lớn vào lãnh địa "làm việc chuyên nghiệp" của con người. Với việc đạt 100% điểm toán AIME và khả năng xử lý các tác vụ thực tế (GDPval) vượt trội, OpenAI đang muốn định vị lại ChatGPT từ một chatbot hỗ trợ sang một "nhân viên ảo" có trình độ chuyên gia.

Hiện tại, người dùng các gói Plus, Pro và Enterprise đã có thể trải nghiệm dần các mô hình này.

Khóa học Machine Learning cơ bản- Khoa học dữ liệu - AI
==***==

Khoá học Quản trị Chiến lược Dành cho Lãnh đạo Doanh nghiệp

Nhấn vào đây để bắt đầu khóa học

==***==
Nơi hội tụ Tinh Hoa Tri Thức - Khơi nguồn Sáng tạo
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com
--- 

Khóa học Hacker và Marketing từ A-Z trên ZALO!

Khóa học Hacker và Marketing từ A-Z trên Facebook!

Khóa đào tạo Power BI phân tích báo cáo để bán hàng thành công

Bảo mật và tấn công Website - Hacker mũ trắng
Hacker mũ trắng
KHÓA HỌC LẬP TRÌNH PYTHON TỪ CƠ BẢN ĐẾN CHUYÊN NGHIỆP

Khóa học Lập trình Visual Foxpro 9 - Dành cho nhà quản lý và kế toán

Khóa học hướng dẫn về Moodle chuyên nghiệp và hay
Xây dựng hệ thống đào tạo trực tuyến chuyên nghiệp tốt nhất hiện nay.



Khóa học AutoIt dành cho dân IT và Marketing chuyên nghiệp

Khoá học Word từ cơ bản tới nâng cao, học nhanh, hiểu sâu


Khóa học hướng dẫn sử dụng Powerpoint từ đơn giản đến phức tạp HIỆU QUẢ
Khóa học Thiết kế, quản lý dữ liệu dự án chuyên nghiệp cho doanh nghiệp bằng Bizagi
Khoa hoc hay
Khóa học Phân tích dữ liệu sử dụng Power Query trong Excel

Khóa học Lập trình WEB bằng PHP từ cơ bản đến nâng cao

Khóa học Phân tích dữ liệu sử dụng TableAU - Chìa khóa thành công!
Nhấn vào đây để bắt đầu khóa học


Khóa học Phân tích dữ liệu sử dụng SPSS - Chìa khóa thành công!


Khóa học "Thiết kế bài giảng điện tử", Video, hoạt hình 
kiếm tiền Youtube bằng phần mềm Camtasia Studio
Khóa học HƯỚNG DẪN THIẾT KẾ VIDEO CLIP CHO DÂN MARKETING CHUYÊN NGHIỆP
Xây dựng website​​​​
HƯỚNG DẪN THIẾT KẾ QUẢNG CÁO VÀ ĐỒ HỌA CHUYÊN NGHIỆP VỚI CANVA
Hãy tham gia khóa học để trở thành người chuyên nghiệp. Tuyệt HAY!😲👍
Khoa hoc hay
MICROSOFT ACCESS



GOOGLE SPREADSHEETS phê không tưởng
Khoa hoc hay
Khóa hoc lập trình bằng Python tại đây

Hãy tham gia khóa học để biết mọi thứ

Để tham gia tất cả các bài học, Bạn nhấn vào đây 

Khóa học lập trình cho bé MSWLogo
Nhấn vào đây để bắt đầu học
Nhấn vào đây để bắt đầu học


Khóa học Ba, Mẹ và Bé - Cùng bé lập trình  TUYỆT VỜI

Khoa hoc hay

Khóa học sử dụng Adobe Presenter-Tạo bài giảng điện tử
Khoa hoc hay
Design Website

Để thành thạo Wordpress bạn hãy tham gia khóa học 
Khóa học sử dụng Edmodo để dạy và học hiện đại để thành công
==***==
Bảo hiểm nhân thọ - Bảo vệ người trụ cột
Cập nhật công nghệ từ Youtube tại link: congnghe.hocviendaotao.com
Tham gia nhóm Facebook
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com

Nguồn: Tinh Tế

About Học viện đào tạo trực tuyến

Xinh chào bạn. Tôi là Đinh Anh Tuấn - Thạc sĩ CNTT. Email: dinhanhtuan68@gmail.com .
- Nhận đào tạo trực tuyến lập trình dành cho nhà quản lý, kế toán bằng Foxpro, Access 2010, Excel, Macro Excel, Macro Word, chứng chỉ MOS cao cấp, IC3, tiếng anh, phần mềm, phần cứng .
- Nhận thiết kế phần mềm quản lý, Web, Web ứng dụng, quản lý, bán hàng,... Nhận Thiết kế bài giảng điện tử, số hóa tài liệu...
HỌC VIỆN ĐÀO TẠO TRỰC TUYẾN:TẬN TÂM-CHẤT LƯỢNG.
«
Next
Bài đăng Mới hơn
»
Previous
Bài đăng Cũ hơn