Header ads

Header ads
» »

#TinhteTest: Thử nghiệm nhanh mô hình gpt-oss-20b trên MacBook Air M3 24GB RAM

MacBook Air M3 từng được Apple cho là chiếc laptop tốt nhất cho AI, mình cũng có bài viết bình luận về vấn đề này. Tuy nhiên, bây giờ thì có lẽ câu đó không còn đúng nữa vì MacBook Air M4 đã ra mắt, dẫu sao mình cũng vẫn muốn thử mô hình gpt-oss trên chiếc MacBook Air M3 24GB RAM của mình, với nhu cầu làm việc thông thường mà mình hay dùng để xem nó giúp mình được đến đâu, mình có cần đến các mô hình chạy trên cloud hay không.

Mô hình gpt-oss là mô hình open weight (gọi nguyên từ gốc cho nó chính xác chứ nó cũng không hẳn là mô hình mã nguồn mở) với hai kích thước là 20b (20 tỷ tham số) và 120b (120 tỷ tham số). Hai phiên bản này dành cho đối tượng sử dụng khác nhau, phiên bản 120b thì dành cho máy cấu hình mạnh, nhiều RAM còn bản 20b thì máy laptop 16GB RAM cũng có thể dùng được. Đã có bài viết chia sẻ về mô hình 120b và chi tiết kỹ thuật của mô hình gpt-oss thì bạn có thể tham khảo dưới đây:

Chi tiết OpenAI gpt-oss: LLM mã nguồn mở miễn phí, suy luận mạnh nhưng chạy được trên máy bàn

Rạng sáng nay 6/8 theo giờ Việt Nam, OpenAI đã bất ngờ công bố hai phiên bản mô hình ngôn ngữ trọng số mở, mã nguồn mở, gpt-oss-120b và gpt-oss-20b....
tinhte.vn

#TinhteTest: Chạy model GPT-OSS:120 tỷ tham số trên Macbook Pro M2 Max 96GB RAM, như GPT-4o online

Trong bài viết này, mình sẽ thử test chi tiết khả năng của model AI miễn phí GPT-OSS 120 tỷ tham số mà OpenAI vừa phát hành mấy ngày qua. Đây là model mạnh nhất trong 2 model miễn phí mà công ty lần đầu tiên phát hành. Khả năng của nó được giới...
tinhte.vn


Mình dùng LM Studio để chạy mô hình gpt-oss 20b

[​IMG]


Giữa Ollama và LM Studio thì mình chọn LM Studio và mình cũng khuyên các bạn dùng LM Studio cho nó dễ, thao tác và cách cài đặt cũng dễ, không phức tạp như Ollama (mặc dù Ollama cũng có WebUI nhưng LM Studio nó là app native nên cài đặt dễ hơn).

LM Studio thì nó hỗ trợ rất rất nhiều mô hình khác nhau, bạn chỉ cần chọn mô hình xong tải về là được. Hiện phiên bản mới nhất của LM Studio đã hỗ trợ đầy đủ cho gpt-oss 120b và cả 20b luôn rồi.

Hướng dẫn sử dụng model ChatGPT miễn phí ngay trên máy tính mac/win của bạn

Sau nhiều năm cố gắng bắt chúng ta nộp tiền thì cuối cùng OpenAI hôm nay cũng đã chịu mở mã nguồn một trong các model của họ để chúng ta tự tải về, tự host và tự xài mà không cần lên online. Hôm nay họ chính thức phát hành model GPT-OSS 120 tỷ và...
tinhte.vn

Giới thiệu LM Studio, phần mềm mã nguồn mở chạy các mô hình ngôn ngữ lớn LLM trực tiếp trên máy tính

Trong chủ đề bài này xin giới thiệu với anh em LM Studio, một phần mềm có thể giúp anh em chạy các mô hình ngôn ngữ lớn (LLM) trực tiếp ngay trên thiết bị, không cần kết nối internet. Có lẽ nhiều anh em đã biết đến LM Studio rồi, thôi thì cứ giới...
tinhte.vn

Điểm hay trên mô hình gpt-oss


Đó là nó cho mình chọn Reasoning Effort với 3 mức: Low, medium và high. Nếu bạn muốn nó trả lời nhanh thì chọn Low, muốn mô hình "suy nghĩ" lâu hơn thì chọn Medium hoặc High, tuy lâu nhưng câu trả lời sẽ kỹ hơn và có thể độ chính xác cao hơn.

Còn các yếu tố khác của một mô hình thì trên LM Studio cũng giống như bao mô hình khác thôi. À, có một điểm mà nếu bạn muốn mô hình trả lời đúng ý của bạn nhất thì hãy điền "system prompt", đây là nơi bạn có thể đưa ra các hướng dẫn để mô hình AI có thể trả lời hiệu quả nhất, ví dụ bạn yêu cầu mô hình phải trả lời bằng tiếng Việt, yêu cầu nó trả lời ngắn gọn, xúc tích, không vòng vo chẳng hạn.

Mình test gì với mô hình gpt-oss-20b?


Chủ yếu mình sẽ thử với các công việc hiện tại của mình ở Tinh tế, chủ yếu liên quan đến nội dung. Nếu cần tra cứu thông tin thì dĩ nhiên mình sẽ chọn các mô hình cloud cho nó tiện, không tiêu tốn tài nguyên máy tính (chỉ tốn tiền haha), còn những gì liên quan đến tài liệu trên máy thì mình dùng gpt-oss.

Điểm mạnh của mô hình gpt-oss thì dễ đoán rồi, nó không cần kết nối internet, không đưa dữ liệu của bạn ra bên ngoài máy tính của bạn do đó bạn có thể yên tâm về khoản bảo mật. Tuy nhiên, gpt-oss hiện mới chỉ có dạng văn bản. Dẫu vậy, với các tra cứu về văn bản trên máy tính thì nó cũng đã hỗ trợ cho công việc của mình khá nhiều.

Quảng cáo


Cách mình tinh chỉnh để phù hợp với cấu hình máy: Apple M3 10-core GPU, 24GB RAM

CleanShot 2025-08-07 at 13.05.20@2x.jpg


Với mô hình gpt-oss-20b mình chạy trên MacBook Air M3 24GB RAM, mình đã thiết lập các thông số như sau:

  • Context Length: 8096 cũng là mức cao nhất phù hợp với cấu hình máy của mình, mặc định thì sẽ là 4096.
  • GPU Offload: mặc định là 6, mình chọn tối đa là 24 luôn, tận dụng triệt để 10 nhân GPU của máy.
  • Evaluation Batch Size: mình chọn 512 nhưng sẽ chậm (mặc định là 256), nhưng mình cũng không quan trọng vụ nhanh chậm lắm, mình quan trọng kết quả.
  • Temp: mình để 0.8, đây là thông số điều chỉnh độ sáng tạo, nếu muốn nó bay bổng hơn thì chỉnh lên số lớn hơn nhưng có thể sẽ bị lan man, còn muốn chính xác và ngắn thì có thể chỉnh nhỏ xuống, nhưng thông tin có thể bị thiếu.
  • Top K Sampling: mình để 20, mặc định là 40 nhưng mình giảm xuống để nó giữ sự tập trung.

Các thông số còn lại đa phần mình để mặc định. Okie bây giờ vào thử mấy bài test với nhu cầu làm việc sáng tạo nội dung của mình xem nó như thế nào.

Thử nghiệm với mô hình gpt-oss-20b


Đầu tiên với những mô hình chạy local trên máy thế này mình rất hay sử dụng cho việc đưa tài liệu vào để hỏi nó những vấn đề liên quan đến tài liệu mà mình không cần mất thời gian để tìm.

CleanShot 2025-08-10 at 14.48.01@2x.jpg

Quảng cáo


Ví dụ, mình hỏi nó về việc so sánh hiệu năng giữa Radeon RX 9070 XT và RTX 5070 Ti trong việc chơi game 1440p native. Lúc đầu mình để Reasoning Effort là medium thì nó suy luận trong khoảng 48 giây nhưng kết quả trả về lại sai thông số của RTX 5070 Ti.
CleanShot 2025-08-10 at 14.57.48@2x.jpg
Mình thử lại với Reasoning Effort là high thì kết quả chính xác, đổi lại thì thời gian suy luận lên đến 2 phút 29 giây.

Không chỉ đưa ra đúng thông số mà mô hình còn kẻ bảng cho mình, chỉ ra sự chênh lệch hiệu năng rasterization giữa Radeon RX 9070 XT và RTX 5070 Ti là bao nhiêu phần trăm. Mô hình còn đưa ra được nhận xét giữa hai mẫu GPU này thì GPU nào cho hiệu năng chơi game nặng tốt hơn.

CleanShot 2025-08-10 at 18.34.34@2x.jpg
Yêu cầu tiếp theo mình muốn đó là nhờ gpt-oss tạo cho mình một outline quay video từ hai tài liệu mình bỏ vào, khi bỏ tài liệu mà mình có trên máy vào LM Studio thì nó sẽ tự động kích hoạt plugin RAG-V1.

Một lưu ý quan trọng đó là nếu bạn muốn mô hình trả lời chính xác thì bạn phải nhập câu lệnh cho nó thật kỹ và chi tiết, càng chi tiết thì mô hình càng hoạt động tốt hơn và sát với yêu cầu của bạn hơn, bạn không thể nào đòi hỏi mô hình phải đoán xem bạn thích kiểu gì được.

CleanShot 2025-08-10 at 15.57.44@2x.jpg
Prompt mình nhập vào khá dài và chi tiết, mình để dự trù context length là 8096 nhưng kết quả cuối cùng nó vẫn bị overload, bị ngưng giữa chừng và chưa hoàn thành outline, mặc dù về cơ bản thì nó đã làm xong outline nhưng đến phần ghi chú bổ sung thì ngưng.
CleanShot 2025-08-10 at 18.43.33@2x.jpg
Mình thử tăng context Length lên 12000 và sau cùng thì nó cũng cho ra kịch bản hoàn chỉnh, nhưng nếu nói để đúng ý mình thì chưa vì nó vẫn chưa thực sự chi tiết.
CleanShot 2025-08-10 at 18.44.47@2x.jpg
Sang bài thử số 3 và mình cũng cho là đơn giản nhất đó là tóm tắt nội dung của một bài viết và nêu ý chính của nó. Kết quả thì đúng với những gì mình kỳ vọng vì đây là một bài viết mà mình đã biên tập, nó nêu đúng với những gì mà nội dung bài viết đề cập.
CleanShot 2025-08-10 at 14.12.32@2x.jpg
Tiếp đến với bài thử số 4 là kêu mô hình viết một câu chuyện từ 100-150 chữ với đề bài "công nghệ thay đổi cuộc sống con người" mình thử với cả gpt-oss 20b và kết quả lần đầu tiên với Reasoning Effort là medium thì câu chuyện nó không có logic lắm, mình vẫn chưa ưng.
CleanShot 2025-08-10 at 14.14.30@2x.jpg
Thử lại với mức high thì câu chuyện bắt đầu có tí logic hơn, đọc qua thì thấy cũng hợp lý nhưng tính thuyết phục mình cũng chưa cao, tạm thời thì có thể dùng được nhưng mình cần chỉnh prompt lại để nó có thể mang tính công nghệ nhiều hơn nữa.
CleanShot 2025-08-10 at 18.46.38@2x.jpg
Mình thử với GPT-5 thì nó cho kết quả hài lòng với mình hơn nhiều, nghe rất tương lai và hiện đại với AR, thực tế tăng cường, AI, giao hàng bằng drone…
CleanShot 2025-08-10 at 14.07.14@2x.jpg
Bài thứ 5 thì mình thử với một câu hỏi suy luận đơn giản để xem gpt-oss-20b xử lý như thế nào, câu hỏi gà có biết bay hay không nếu gà là chim. Câu trả lời của gpt-oss-20b như bạn thấy thì nó vẫn cho thấy thực tế gà có thể bay nhưng không thể bay lâu hoặc bay xa, nhưng không giải thích thêm lý do vì sao, vì xương gà và xương của các loài chim biết bay khác nhau ở chỗ nào.

Tốc độ thực thi

CleanShot 2025-08-10 at 14.14.30@2x.jpg


Qua những bài thử đơn giản của mình thì mình thấy rằng số lượng token mà mô hình tạo ra mỗi ngay trung bình khoảng 17-20 token/sec, thời gian tạo ra token đầu tiên trung bình khoảng 7 giây với Reasoning Effort ở mức high, còn nếu để low thì thời gian "bắn" token rất nhanh, chưa đến 1 giây.
CleanShot 2025-08-10 at 13.38.46@2x.jpg
Với cá nhân mình thấy thì con số này là ổn với một mô hình chạy local trên máy, đặc biệt lại là MacBook Air M3, một SoC chỉ có 10 nhân GPU, 8 nhân CPU, 24GB Unified Memory với băng thông bộ nhớ chỉ 100GB/s.

Nếu bạn chỉ dùng để hỏi đáp đơn giản, index từ các tài liệu cá nhân, phục vụ nhu cầu học tập thì nó hoàn toàn đáp ứng được, mình thích cách mà mô hình có thể index tài liệu mà mình đưa vào và trả lời chính xác, nhanh, không lan man, như vậy là quá hài lòng. Nói gì thì nói, gpt-oss-20b cũng là mô hình dành cho những chiếc laptop cá nhân, phục vụ nhu cầu hỏi đáp cá nhân, nhất là những chiếc laptop không có cấu hình quá mạnh. Mình sẽ thử trên một chiếc laptop Windows có GPU rời để xem hiệu quả của nó có cải thiện so với MacBook Air M3 hay không.

Khóa học Machine Learning cơ bản- Khoa học dữ liệu - AI
==***==

Khoá học Quản trị Chiến lược Dành cho Lãnh đạo Doanh nghiệp

Nhấn vào đây để bắt đầu khóa học

==***==
Nơi hội tụ Tinh Hoa Tri Thức - Khơi nguồn Sáng tạo
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com
--- 

Khóa học Hacker và Marketing từ A-Z trên ZALO!

Khóa học Hacker và Marketing từ A-Z trên Facebook!

Khóa đào tạo Power BI phân tích báo cáo để bán hàng thành công

Bảo mật và tấn công Website - Hacker mũ trắng
Hacker mũ trắng
KHÓA HỌC LẬP TRÌNH PYTHON TỪ CƠ BẢN ĐẾN CHUYÊN NGHIỆP

Khóa học Lập trình Visual Foxpro 9 - Dành cho nhà quản lý và kế toán

Khóa học hướng dẫn về Moodle chuyên nghiệp và hay
Xây dựng hệ thống đào tạo trực tuyến chuyên nghiệp tốt nhất hiện nay.



Khóa học AutoIt dành cho dân IT và Marketing chuyên nghiệp

Khoá học Word từ cơ bản tới nâng cao, học nhanh, hiểu sâu


Khóa học hướng dẫn sử dụng Powerpoint từ đơn giản đến phức tạp HIỆU QUẢ
Khóa học Thiết kế, quản lý dữ liệu dự án chuyên nghiệp cho doanh nghiệp bằng Bizagi
Khoa hoc hay
Khóa học Phân tích dữ liệu sử dụng Power Query trong Excel

Khóa học Lập trình WEB bằng PHP từ cơ bản đến nâng cao

Khóa học Phân tích dữ liệu sử dụng TableAU - Chìa khóa thành công!
Nhấn vào đây để bắt đầu khóa học


Khóa học Phân tích dữ liệu sử dụng SPSS - Chìa khóa thành công!


Khóa học "Thiết kế bài giảng điện tử", Video, hoạt hình 
kiếm tiền Youtube bằng phần mềm Camtasia Studio
Khóa học HƯỚNG DẪN THIẾT KẾ VIDEO CLIP CHO DÂN MARKETING CHUYÊN NGHIỆP
Xây dựng website​​​​
HƯỚNG DẪN THIẾT KẾ QUẢNG CÁO VÀ ĐỒ HỌA CHUYÊN NGHIỆP VỚI CANVA
Hãy tham gia khóa học để trở thành người chuyên nghiệp. Tuyệt HAY!😲👍
Khoa hoc hay
MICROSOFT ACCESS



GOOGLE SPREADSHEETS phê không tưởng
Khoa hoc hay
Khóa hoc lập trình bằng Python tại đây

Hãy tham gia khóa học để biết mọi thứ

Để tham gia tất cả các bài học, Bạn nhấn vào đây 

Khóa học lập trình cho bé MSWLogo
Nhấn vào đây để bắt đầu học
Nhấn vào đây để bắt đầu học


Khóa học Ba, Mẹ và Bé - Cùng bé lập trình  TUYỆT VỜI

Khoa hoc hay

Khóa học sử dụng Adobe Presenter-Tạo bài giảng điện tử
Khoa hoc hay
Design Website

Để thành thạo Wordpress bạn hãy tham gia khóa học 
Khóa học sử dụng Edmodo để dạy và học hiện đại để thành công
==***==
Bảo hiểm nhân thọ - Bảo vệ người trụ cột
Cập nhật công nghệ từ Youtube tại link: congnghe.hocviendaotao.com
Tham gia nhóm Facebook
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com

Nguồn: Tinh Tế

About Học viện đào tạo trực tuyến

Xinh chào bạn. Tôi là Đinh Anh Tuấn - Thạc sĩ CNTT. Email: dinhanhtuan68@gmail.com .
- Nhận đào tạo trực tuyến lập trình dành cho nhà quản lý, kế toán bằng Foxpro, Access 2010, Excel, Macro Excel, Macro Word, chứng chỉ MOS cao cấp, IC3, tiếng anh, phần mềm, phần cứng .
- Nhận thiết kế phần mềm quản lý, Web, Web ứng dụng, quản lý, bán hàng,... Nhận Thiết kế bài giảng điện tử, số hóa tài liệu...
HỌC VIỆN ĐÀO TẠO TRỰC TUYẾN:TẬN TÂM-CHẤT LƯỢNG.
«
Next
Bài đăng Mới hơn
»
Previous
Bài đăng Cũ hơn