OpenAI đã cho ra mắt mô hình ngôn ngữ GPT-4 khoảng 1 năm trước. Nó là một bản nâng cấp rất mạnh so với GPT-3 và sau đó là GPT-3.5. Nhưng câu hỏi vẫn là, tới khi nào GPT-5 sẽ được OpenAI tung ra. Trong những cuộc phỏng vấn hay xuất hiện trước truyền thông, CEO Sam Altman luôn tránh né câu hỏi này.
Nhưng mới đây theo một bài viết của Business Insider, GPT-5, phiên bản mới nhất của mô hình ngôn ngữ được OpenAI phát triển và vận hành có thể sẽ ra mắt ngay trong mùa hè năm nay. Hai nguồn tin nội bộ của OpenAI cách đây 1 tuần đã cho biết, bản thử nghiệm của GPT-5 đã được OpenAI giao cho những đối tác doanh nghiệp, để thấy những cải tiến trong ChatGPT vận hành dựa trên GPT-4 so với GPT-5. Một CEO doanh nghiệp được chiêm ngưỡng sức mạnh của GPT-5 mô tả nó là một mô hình ngôn ngữ rất mạnh, tốt hơn hẳn so với GPT-4.
Cùng lúc, Sam Altman trên podcast của Lex Fridman cũng đã hé lộ những thông tin về thời điểm ra mắt GPT-5: "Chúng tôi sẽ tung mô hình ngôn ngữ này ra thị trường trong vài tháng tới, bên cạnh những công cụ khác đang được phát triển. Tôi nghĩ mô hình ngôn ngữ này sẽ rất ngon. Nhưng mà trước khi nói đến bản thân mô hình GPT-5 và những ứng dụng vận hành dựa trên GPT-5, tôi nghĩ sẽ còn rất nhiều những thứ quan trọng khác sẽ được chúng tôi cho ra mắt trước."
Nguồn tin nội bộ của OpenAI nói, GPT-5 hiện tại đang hoàn tất quá trình huấn luyện nhờ dữ liệu con người tạo ra. Sau đó, nó sẽ được đưa vào giai đoạn thử nghiệm nội bộ để đảm bảo những hàng rào an toàn vận hành như ý muốn của con người. Mọi vấn đề nảy sinh đều phải được chỉnh sửa và khắc phục trước khi GPT-5 chính thức ra mắt công chúng.
Giống như GPT-4, GPT-5, hay mô hình ngôn ngữ thế hệ mới do OpenAI nghiên cứu cũng sẽ là một mô hình ngôn ngữ quy mô lớn với nhiều chế độ nội dung, từ hình ảnh đến văn bản. Nó vẫn có thể nhận câu lệnh dạng văn bản hoặc hình ảnh để xử lý lệnh mà con người yêu cầu. Về mặt vận hành, GPT-5 vẫn sẽ hoạt động theo hướng dự đoán và nội suy dạng next-token, dựa vào những nội dung và dữ liệu nó được huấn luyện trước đó để tạo ra những cụm ký tự, những đoạn văn với chất lượng hợp lý, phục vụ cho nhiều nhu cầu như viết luận văn hay tổng hợp thông tin.
GPT-4 ra mắt vào tháng 3/2023, là bản nâng cấp lớn so với GPT-3, ra mắt năm 2020, và sau đó là bản nâng cấp GPT-3.5 hồi cuối năm 2022. Rồi đến tháng 11/2023, GPT-4 Turbo đã được ra mắt, với lợi thế lớn nhất là giảm chi phí nội suy tạo nội dung khi chạy trên những data center phục vụ các dịch vụ chatbot AI. Tuy nhiên GPT-4 Turbo đã có vài lần bị phát hiện là "lười biếng" khi mô hình ngôn ngữ không chịu trả lời câu lệnh của người dùng, hoặc hoàn thiện những dòng code mà con người yêu cầu mô hình AI viết.
Để có được sức mạnh như vậy, GPT hay bất kỳ mô hình ngôn ngữ do các tập đoàn công nghệ phát triển đều cần lượng dữ liệu đầu vào khổng lồ để phục vụ quá trình huấn luyện cho thuật toán machine learning và neural network. Hầu hết dữ liệu này đều được thu thập từ các dịch vụ và nền tảng trực tuyến trên mạng internet, thường phải bỏ tiền mua lại từ chủ sở hữu và đơn vị vận hành dịch vụ trực tuyến, như các mạng xã hội Facebook, Twitter và Reddit, hay những cơ sở dữ liệu văn bản và hình ảnh của các đơn vị nắm giữ bản quyền hay các tập đoàn truyền thông.
Chất lượng dữ liệu và văn bản mà mô hình AI tạo ra luôn luôn phụ thuộc vào chất lượng bộ cơ sở dữ liệu dùng để huấn luyện mô hình AI, và dựa vào yếu tố kiểm soát mô hình, để chatbot không có xu hướng tổng hợp những thông tin sai, hoặc tệ hơn là bịa đặt thông tin cho người dùng. Trường hợp bịa đặt thông tin được gọi bằng khái niệm "AI bị loạn", hay tiếng Anh gọi là hallucination.
Theo ArsTechnica
Nhưng mới đây theo một bài viết của Business Insider, GPT-5, phiên bản mới nhất của mô hình ngôn ngữ được OpenAI phát triển và vận hành có thể sẽ ra mắt ngay trong mùa hè năm nay. Hai nguồn tin nội bộ của OpenAI cách đây 1 tuần đã cho biết, bản thử nghiệm của GPT-5 đã được OpenAI giao cho những đối tác doanh nghiệp, để thấy những cải tiến trong ChatGPT vận hành dựa trên GPT-4 so với GPT-5. Một CEO doanh nghiệp được chiêm ngưỡng sức mạnh của GPT-5 mô tả nó là một mô hình ngôn ngữ rất mạnh, tốt hơn hẳn so với GPT-4.
Cùng lúc, Sam Altman trên podcast của Lex Fridman cũng đã hé lộ những thông tin về thời điểm ra mắt GPT-5: "Chúng tôi sẽ tung mô hình ngôn ngữ này ra thị trường trong vài tháng tới, bên cạnh những công cụ khác đang được phát triển. Tôi nghĩ mô hình ngôn ngữ này sẽ rất ngon. Nhưng mà trước khi nói đến bản thân mô hình GPT-5 và những ứng dụng vận hành dựa trên GPT-5, tôi nghĩ sẽ còn rất nhiều những thứ quan trọng khác sẽ được chúng tôi cho ra mắt trước."
Nguồn tin nội bộ của OpenAI nói, GPT-5 hiện tại đang hoàn tất quá trình huấn luyện nhờ dữ liệu con người tạo ra. Sau đó, nó sẽ được đưa vào giai đoạn thử nghiệm nội bộ để đảm bảo những hàng rào an toàn vận hành như ý muốn của con người. Mọi vấn đề nảy sinh đều phải được chỉnh sửa và khắc phục trước khi GPT-5 chính thức ra mắt công chúng.
Mô hình ngôn ngữ AI tạo văn bản bằng cách nào?
Giống như GPT-4, GPT-5, hay mô hình ngôn ngữ thế hệ mới do OpenAI nghiên cứu cũng sẽ là một mô hình ngôn ngữ quy mô lớn với nhiều chế độ nội dung, từ hình ảnh đến văn bản. Nó vẫn có thể nhận câu lệnh dạng văn bản hoặc hình ảnh để xử lý lệnh mà con người yêu cầu. Về mặt vận hành, GPT-5 vẫn sẽ hoạt động theo hướng dự đoán và nội suy dạng next-token, dựa vào những nội dung và dữ liệu nó được huấn luyện trước đó để tạo ra những cụm ký tự, những đoạn văn với chất lượng hợp lý, phục vụ cho nhiều nhu cầu như viết luận văn hay tổng hợp thông tin.
GPT-4 ra mắt vào tháng 3/2023, là bản nâng cấp lớn so với GPT-3, ra mắt năm 2020, và sau đó là bản nâng cấp GPT-3.5 hồi cuối năm 2022. Rồi đến tháng 11/2023, GPT-4 Turbo đã được ra mắt, với lợi thế lớn nhất là giảm chi phí nội suy tạo nội dung khi chạy trên những data center phục vụ các dịch vụ chatbot AI. Tuy nhiên GPT-4 Turbo đã có vài lần bị phát hiện là "lười biếng" khi mô hình ngôn ngữ không chịu trả lời câu lệnh của người dùng, hoặc hoàn thiện những dòng code mà con người yêu cầu mô hình AI viết.
Để có được sức mạnh như vậy, GPT hay bất kỳ mô hình ngôn ngữ do các tập đoàn công nghệ phát triển đều cần lượng dữ liệu đầu vào khổng lồ để phục vụ quá trình huấn luyện cho thuật toán machine learning và neural network. Hầu hết dữ liệu này đều được thu thập từ các dịch vụ và nền tảng trực tuyến trên mạng internet, thường phải bỏ tiền mua lại từ chủ sở hữu và đơn vị vận hành dịch vụ trực tuyến, như các mạng xã hội Facebook, Twitter và Reddit, hay những cơ sở dữ liệu văn bản và hình ảnh của các đơn vị nắm giữ bản quyền hay các tập đoàn truyền thông.
Chất lượng dữ liệu và văn bản mà mô hình AI tạo ra luôn luôn phụ thuộc vào chất lượng bộ cơ sở dữ liệu dùng để huấn luyện mô hình AI, và dựa vào yếu tố kiểm soát mô hình, để chatbot không có xu hướng tổng hợp những thông tin sai, hoặc tệ hơn là bịa đặt thông tin cho người dùng. Trường hợp bịa đặt thông tin được gọi bằng khái niệm "AI bị loạn", hay tiếng Anh gọi là hallucination.
Theo ArsTechnica
==***==
==***==
Nơi hội tụ Tinh Hoa Tri Thức - Khơi nguồn Sáng tạo
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com
---
Khóa học Hacker và Marketing từ A-Z trên ZALO!
Khóa học Hacker và Marketing từ A-Z trên Facebook!
Bảo mật và tấn công Website - Hacker mũ trắng
KHÓA HỌC LẬP TRÌNH PYTHON TỪ CƠ BẢN ĐẾN CHUYÊN NGHIỆP
Khóa học Lập trình Visual Foxpro 9 - Dành cho nhà quản lý và kế toán
Khóa học hướng dẫn về Moodle chuyên nghiệp và hay Xây dựng hệ thống đào tạo trực tuyến chuyên nghiệp tốt nhất hiện nay.
Khóa học AutoIt dành cho dân IT và Marketing chuyên nghiệp
Khoá học Word từ cơ bản tới nâng cao, học nhanh, hiểu sâu
Khóa học hướng dẫn sử dụng Powerpoint từ đơn giản đến phức tạp HIỆU QUẢ Khóa học Thiết kế, quản lý dữ liệu dự án chuyên nghiệp cho doanh nghiệp bằng Bizagi Khóa học Phân tích dữ liệu sử dụng Power Query trong Excel
Khóa học Lập trình WEB bằng PHP từ cơ bản đến nâng cao
Khóa học "Thiết kế bài giảng điện tử", Video, hoạt hình kiếm tiền Youtube bằng phần mềm Camtasia Studio Khóa học HƯỚNG DẪN THIẾT KẾ VIDEO CLIP CHO DÂN MARKETING CHUYÊN NGHIỆP HƯỚNG DẪN THIẾT KẾ QUẢNG CÁO VÀ ĐỒ HỌA CHUYÊN NGHIỆP VỚI CANVA Hãy tham gia khóa học để trở thành người chuyên nghiệp. Tuyệt HAY!😲👍
GOOGLE SPREADSHEETS phê không tưởng Hãy tham gia khóa học để biết mọi thứ
Khóa học sử dụng Adobe Presenter-Tạo bài giảng điện tử
Để thành thạo Wordpress bạn hãy tham gia khóa học Khóa học sử dụng Edmodo để dạy và học hiện đại để thành công ==***== Bảo hiểm nhân thọ - Bảo vệ người trụ cột Cập nhật công nghệ từ Youtube tại link: congnghe.hocviendaotao.com
Tham gia nhóm Facebook
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com
Bảo mật và tấn công Website - Hacker mũ trắng
KHÓA HỌC LẬP TRÌNH PYTHON TỪ CƠ BẢN ĐẾN CHUYÊN NGHIỆP

Khóa học AutoIt dành cho dân IT và Marketing chuyên nghiệp
Khoá học Word từ cơ bản tới nâng cao, học nhanh, hiểu sâu
Khóa học hướng dẫn sử dụng Powerpoint từ đơn giản đến phức tạp HIỆU QUẢ
Khóa học Thiết kế, quản lý dữ liệu dự án chuyên nghiệp cho doanh nghiệp bằng Bizagi
Khóa học Phân tích dữ liệu sử dụng Power Query trong Excel
Khóa học Lập trình WEB bằng PHP từ cơ bản đến nâng cao
kiếm tiền Youtube bằng phần mềm Camtasia Studio
Khóa học HƯỚNG DẪN THIẾT KẾ VIDEO CLIP CHO DÂN MARKETING CHUYÊN NGHIỆP
HƯỚNG DẪN THIẾT KẾ QUẢNG CÁO VÀ ĐỒ HỌA CHUYÊN NGHIỆP VỚI CANVA
Hãy tham gia khóa học để trở thành người chuyên nghiệp. Tuyệt HAY!😲👍
GOOGLE SPREADSHEETS phê không tưởng
Hãy tham gia khóa học để biết mọi thứ
Khóa học sử dụng Adobe Presenter-Tạo bài giảng điện tử
Để thành thạo Wordpress bạn hãy tham gia khóa học
Khóa học sử dụng Edmodo để dạy và học hiện đại để thành công
==***==
Bảo hiểm nhân thọ - Bảo vệ người trụ cột
Tham gia nhóm Facebook
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com
Nguồn: Tinh Tế

Topics: Công nghệ mới