Header ads

Header ads
» »

DeepSeek âm thầm ra mắt bản nâng cấp mô hình AI suy luận logic R1-0528

DeepSeek, một startup trí tuệ nhân tạo (AI) của Trung Quốc, vừa phát hành bản cập nhật đầu tiên cho mô hình reasoning ăn khách R1 vào hôm 29/5, từ đó tăng cường khả năng cạnh tranh với các đối thủ ở Mỹ như OpenAI.

Theo thông báo trên nền tảng dành cho nhà phát triển Hugging Face, phiên bản R1-0528 là một nâng cấp nhỏ cho R1, nhưng vẫn cải thiện đáng kể khả năng suy luận và phân tích sâu sắc, bao gồm cả việc xử lý tốt hơn các tác vụ phức tạp, đưa hiệu suất của nó đến gần với các mô hình suy luận o3 của OpenAI và Gemini 2.5 Pro của Google.

Sự ra mắt của R1 vào hồi tháng 1/2025 đã giúp cái tên của startup này bùng nổ trên quy mô toàn cầu, khiến giá cổ phiếu công nghệ bên ngoài Trung Quốc giảm mạnh và thách thức quan điểm cho rằng việc mở rộng AI đòi hỏi sức mạnh tính toán và đầu tư khổng lồ. Kể từ khi R1 được phát hành, các gã khổng lồ công nghệ của Trung Quốc như Alibaba và Tencent đã tung ra các mô hình tuyên bố vượt trội hơn DeepSeek.

Bản cập nhật hôm thứ Năm ban đầu thiếu chi tiết, trái ngược với sự ra mắt của R1 vào tháng Giêng, đi kèm với một bài báo học thuật do nhiều tác giả viết, mà cộng đồng AI trên toàn thế giới đã phân tích để hiểu rõ chiến lược của công ty.

Công ty có trụ sở tại Hàng Châu sau đó đăng tải ngắn gọn trên MXH X rằng R1-0528 có hiệu suất được cải thiện. Trong một bài đăng dài hơn trên WeChat, DeepSeek cho biết tỷ lệ "ảo giác", khiến nội dung đầu ra sai lệch về thông tin hoặc gây hiểu lầm, đã giảm khoảng 45% đến 50% trong các tác vụ như viết lại và tóm tắt văn bản.


Công ty cũng cho biết bản cập nhật này còn giúp mô hình có khả năng sáng tạo viết luận, tiểu thuyết và các thể loại khác, đồng thời cải thiện khả năng tạo code lập trình giao diện người dùng. "Mô hình đã chứng minh hiệu suất xuất sắc trong nhiều bài đánh giá chuẩn, bao gồm toán học, lập trình và logic chung," DeepSeek cho biết.

Sự thành công của DeepSeek đã đảo ngược niềm tin rằng các biện pháp kiểm soát xuất khẩu của Mỹ đang kìm hãm sự tiến bộ AI của Trung Quốc, sau khi nó phát hành các mô hình AI ngang hàng hoặc tốt hơn so với các mô hình hàng đầu trong ngành ở Mỹ với chi phí thấp hơn đáng kể.

Startup Trung Quốc cho biết thêm vào ngày 29/5, rằng một biến thể của bản cập nhật của họ đã được tạo ra bằng cách sử dụng quy trình suy luận được vận hành bởi mô hình R1-0528 để tiếp tục nâng cao mô hình Qwen 3 8B Base của gã khổng lồ công nghệ Trung Quốc Alibaba, thông qua một quá trình được gọi là chưng cất dữ liệu. Kết quả là hiệu suất vượt trội hơn so với mô hình Qwen 3 ban đầu hơn 10%.

"Chúng tôi tin rằng chuỗi suy nghĩ từ DeepSeek-R1-0528 sẽ có ý nghĩa quan trọng đối với cả nghiên cứu học thuật về các mô hình reasoning và phát triển công nghiệp tập trung vào các mô hình quy mô nhỏ," DeepSeek bổ sung.

Bloomberg đã đưa tin về bản cập nhật này vào ngày thứ Tư. Báo cáo cho biết một đại diện của DeepSeek đã thông báo trong một nhóm WeChat rằng họ đã hoàn thành những gì họ gọi là "nâng cấp thử nghiệm nhỏ" và người dùng có thể bắt đầu kiểm tra nó.

Phản ứng lại sự cạnh tranh từ DeepSeek, Gemini của Google đã giới thiệu các tầng truy cập giảm giá, trong khi OpenAI cắt giảm giá và phát hành mô hình o3 Mini dựa trên ít sức mạnh tính toán hơn.
DeepSeek vẫn được kỳ vọng sẽ sớm phát hành R2, phiên bản kế nhiệm của R1. Reuters đưa tin vào hồi tháng 3, trích dẫn các nguồn tin giấu tên rằng việc phát hành R2 ban đầu dự kiến vào hồi tháng 5. DeepSeek cũng đã phát hành một bản nâng cấp cho mô hình ngôn ngữ lớn V3 của họ vào tháng 3.

Theo Nikkei

Quảng cáo


Anh em không cmt được vào bài vui lòng xác thực tài khoản tại https://tinhte.vn/xacthuc nha. Sau khi xác thực thì anh em sẽ sử dụng được full tính năng của diễn đàn.

Khóa học Machine Learning cơ bản- Khoa học dữ liệu - AI
==***==

Khoá học Quản trị Chiến lược Dành cho Lãnh đạo Doanh nghiệp

Nhấn vào đây để bắt đầu khóa học

==***==
Nơi hội tụ Tinh Hoa Tri Thức - Khơi nguồn Sáng tạo
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com
--- 

Khóa học Hacker và Marketing từ A-Z trên ZALO!

Khóa học Hacker và Marketing từ A-Z trên Facebook!

Khóa đào tạo Power BI phân tích báo cáo để bán hàng thành công

Bảo mật và tấn công Website - Hacker mũ trắng
Hacker mũ trắng
KHÓA HỌC LẬP TRÌNH PYTHON TỪ CƠ BẢN ĐẾN CHUYÊN NGHIỆP

Khóa học Lập trình Visual Foxpro 9 - Dành cho nhà quản lý và kế toán

Khóa học hướng dẫn về Moodle chuyên nghiệp và hay
Xây dựng hệ thống đào tạo trực tuyến chuyên nghiệp tốt nhất hiện nay.



Khóa học AutoIt dành cho dân IT và Marketing chuyên nghiệp

Khoá học Word từ cơ bản tới nâng cao, học nhanh, hiểu sâu


Khóa học hướng dẫn sử dụng Powerpoint từ đơn giản đến phức tạp HIỆU QUẢ
Khóa học Thiết kế, quản lý dữ liệu dự án chuyên nghiệp cho doanh nghiệp bằng Bizagi
Khoa hoc hay
Khóa học Phân tích dữ liệu sử dụng Power Query trong Excel

Khóa học Lập trình WEB bằng PHP từ cơ bản đến nâng cao

Khóa học Phân tích dữ liệu sử dụng TableAU - Chìa khóa thành công!
Nhấn vào đây để bắt đầu khóa học


Khóa học Phân tích dữ liệu sử dụng SPSS - Chìa khóa thành công!


Khóa học "Thiết kế bài giảng điện tử", Video, hoạt hình 
kiếm tiền Youtube bằng phần mềm Camtasia Studio
Khóa học HƯỚNG DẪN THIẾT KẾ VIDEO CLIP CHO DÂN MARKETING CHUYÊN NGHIỆP
Xây dựng website​​​​
HƯỚNG DẪN THIẾT KẾ QUẢNG CÁO VÀ ĐỒ HỌA CHUYÊN NGHIỆP VỚI CANVA
Hãy tham gia khóa học để trở thành người chuyên nghiệp. Tuyệt HAY!😲👍
Khoa hoc hay
MICROSOFT ACCESS



GOOGLE SPREADSHEETS phê không tưởng
Khoa hoc hay
Khóa hoc lập trình bằng Python tại đây

Hãy tham gia khóa học để biết mọi thứ

Để tham gia tất cả các bài học, Bạn nhấn vào đây 

Khóa học lập trình cho bé MSWLogo
Nhấn vào đây để bắt đầu học
Nhấn vào đây để bắt đầu học


Khóa học Ba, Mẹ và Bé - Cùng bé lập trình  TUYỆT VỜI

Khoa hoc hay

Khóa học sử dụng Adobe Presenter-Tạo bài giảng điện tử
Khoa hoc hay
Design Website

Để thành thạo Wordpress bạn hãy tham gia khóa học 
Khóa học sử dụng Edmodo để dạy và học hiện đại để thành công
==***==
Bảo hiểm nhân thọ - Bảo vệ người trụ cột
Cập nhật công nghệ từ Youtube tại link: congnghe.hocviendaotao.com
Tham gia nhóm Facebook
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com

Nguồn: Tinh Tế

About Học viện đào tạo trực tuyến

Xinh chào bạn. Tôi là Đinh Anh Tuấn - Thạc sĩ CNTT. Email: dinhanhtuan68@gmail.com .
- Nhận đào tạo trực tuyến lập trình dành cho nhà quản lý, kế toán bằng Foxpro, Access 2010, Excel, Macro Excel, Macro Word, chứng chỉ MOS cao cấp, IC3, tiếng anh, phần mềm, phần cứng .
- Nhận thiết kế phần mềm quản lý, Web, Web ứng dụng, quản lý, bán hàng,... Nhận Thiết kế bài giảng điện tử, số hóa tài liệu...
HỌC VIỆN ĐÀO TẠO TRỰC TUYẾN:TẬN TÂM-CHẤT LƯỢNG.
«
Next
Bài đăng Mới hơn
»
Previous
Bài đăng Cũ hơn