Header ads

Header ads
» »

Kỹ sư Apple: Đã tìm được cách chạy mô hình ngôn ngữ trên chip iPhone

Thực tế vận hành những mô hình ngôn ngữ (LLM) hay thuật toán AI không chỉ phụ thuộc vào tốc độ xử lý số thực dấu phẩy động, tính theo đơn vị tera hay thậm chí là exaflop của chip xử lý, mà còn phụ thuộc cả vào dung lượng cũng như băng thông bộ nhớ để mô hình xử lý hàng trăm triệu tham số, tạo ra nội dung cho người dùng. Đấy là một lý do những thiết bị điện tử tiêu dùng thường không đủ sức mạnh để xử lý những thuật toán hay mô hình ngôn ngữ lớn, mà hầu hết các dịch vụ đều chạy trên data center rồi gửi kết quả về thiết bị đầu cuối.

Các kỹ sư và nhà nghiên cứu của Apple vừa tuyên bố tìm ra cách vận hành LLM trên những thiết bị bị giới hạn về dung lượng bộ nhớ, như iPhone chẳng hạn. Giải pháp mà các nhà nghiên cứu AI của Apple hoàn toàn có thể mô tả như một bước đột phá. Lý do là, hiểu theo cách đơn giản ngắn gọn, thay vì tải toàn bộ mô hình vào bộ nhớ RAM của chip xử lý, thì Apple đã tìm ra cách lưu trữ tạm thời toàn bộ mô hình vào bộ nhớ flash dùng để lưu trữ của thiết bị, rồi tối ưu quá trình này để những chip Neural Engine vận hành xử lý thuật toán.

Đó là kết quả của công trình nghiên cứu mang tên: "LLM trong bộ nhớ flash: Nội suy hiệu quả mô hình ngôn ngữ với bộ nhớ bị giới hạn." Những tác giả của công trình nghiên cứu mà Apple vừa mới công bố này cho rằng, bộ nhớ flash lưu trữ dữ liệu bên trong những chiếc điện thoại hay máy tính luôn có dung lượng lớn hơn bộ nhớ RAM dùng để chuyển dữ liệu vào chip xử lý. Giải pháp được đưa ra là vượt qua hai giới hạn của kỹ thuật xử lý vận hành mô hình ngôn ngữ hiện tại, vừa giảm lượng dữ liệu luân chuyển, vừa tối ưu băng thông bộ nhớ flash thông qua hai bước:

  • Windowing: Kỹ thuật này giống hệt như một cách "tái chế" dữ liệu. Thay vì cứ mỗi lần chạy LLM, thiết bị lại tải dữ liệu mới một lần nữa, thì mô hình AI sẽ tái sử dụng một phần dữ liệu trước đó thiết bị đã xử lý được. Điều này giúp giảm tần suất lấy dữ liệu vào bộ nhớ, từ đó giúp quá trình xử lý nhanh và mượt hơn.
  • Row-Column Bundling: Kỹ thuật này có thể mô tả dễ hiểu theo kiểu đọc nhanh một cuốn sách theo nội dung của từng đoạn văn, thay vì đọc chính xác từng từ từng chữ. Giải pháp này gom dữ liệu để xử lý hiệu quả hơn, đọc nhanh hơn từ bộ nhớ flash của thiết bị, từ đó tăng tốc độ hiểu và tạo ra câu trả lời của mô hình ngôn ngữ AI.

Kết hợp hai kỹ thuật này, mô hình AI có thể có kích thước gấp đôi dung lượng RAM của một chiếc iPhone, theo báo cáo khoa học của cuộc nghiên cứu. Điều này đồng nghĩa với việc, nếu vận hành mô hình ngôn ngữ trên CPU, tốc độ sẽ nhanh hơn từ 4 đến 5 lần. Và nếu vận hành trên GPU với rất nhiều nhân tính toán số thực dấu phẩy động, thì tốc độ sẽ nhanh hơn từ 20 đến 25 lần. Con số kể trên là so sánh với việc tải toàn bộ dữ liệu mô hình ngôn ngữ vào RAM rồi để SoC xử lý.

Các nhà nghiên cứu tại Apple viết: "Đột phá này cực kỳ quan trọng để vận hành những LLM cao cấp trên những môi trường nền tảng thiết bị giới hạn về phần cứng, nhờ đó mở rộng được hiệu quả và độ phủ của giải pháp AI."

Về mặt ứng dụng, nghiên cứu mới này hoàn toàn có thể cho phép Siri trở nên thông minh hơn, có nhiều khả năng hữu ích hơn như đưa ra những câu trả lời chi tiết cho một vấn đề, hay hỗ trợ dịch thuật theo thời gian thực nhờ vào khả năng nhận diện ngôn ngữ của mô hình AI. Hoặc thậm chí nếu cần vận hành chatbot ngay trên iPhone cũng sẽ trở nên khả thi. Hiện tại đang có những tin đồn nói rằng Apple đang phát triển chatbot.

Hồi tháng 2/2023, Apple đã tổ chức một hội thảo AI nội bộ, đưa ra thông tin cho các nhân viên rằng Apple đang phát triển mô hình ngôn ngữ lớn. Theo Bloomberg, Apple đang muốn tạo ra một phiên bản Siri thông minh hơn, tích hợp hoàn chỉnh với mô hình AI. Nhờ đó, Siri sẽ có thể tương tác với nhiều ứng dụng, bao gồm cả ứng dụng nhắn tin, chẳng hạn như phục vụ việc tự động hoàn thành những câu viết dài. Cùng lúc, Apple cũng được cho là đang có tham vọng đưa AI vào mọi dịch vụ họ vận hành.

Mô hình mà Apple phát triển, theo những nguồn tin không chính thức, có tên mã Ajax. Nó được thiết kế để cạnh tranh với những giải pháp như Claude hay GPT-3, và được vận hành dựa trên 200 tỷ tham số, đủ để có khả năng nhận diện và tạo nội dung ngôn ngữ phức tạp.

Tính đến thời điểm hiện tại, những nguồn tin đồn nói rằng, Ajax của Apple có khả năng tạo nội dung và nhận diện ngôn ngữ tốt hơn những phiên bản đầu tiên của GPT-3.5 do OpenAI phát triển. Nhưng tính đến tháng 9/2023, sức mạnh của GPT-3.5 hay GPT-4 đã vượt xa khả năng của Ajax. Tờ The Information từng đưa tin, rằng cuối năm 2024, những tính năng dựa trên mô hình ngôn ngữ sẽ ra mắt iPhone và iPad, thời điểm iOS 18 ra mắt. Và với việc Apple đang xây dựng rồi đưa vào vận hành vài trăm server phục vụ xử lý thuật toán AI, thì những giải pháp dựa trên mô hình ngôn ngữ họ phát triển sẽ có cả hai phiên bản chạy trên data center lẫn chạy local trên thiết bị của anh em.

Theo MacRumors

CHUYÊN MỤC NGHỆ THUẬT LÀM GIÀU BỀN VỮNG
Khóa học Machine Learning cơ bản- Khoa học dữ liệu - AI
==***==

Khoá học Quản trị Chiến lược Dành cho Lãnh đạo Doanh nghiệp

Nhấn vào đây để bắt đầu khóa học

==***==
Nơi hội tụ Tinh Hoa Tri Thức - Khơi nguồn Sáng tạo
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com
--- 

Khóa học Hacker và Marketing từ A-Z trên ZALO!

Khóa học Hacker và Marketing từ A-Z trên Facebook!

Khóa đào tạo Power BI phân tích báo cáo để bán hàng thành công

Bảo mật và tấn công Website - Hacker mũ trắng
Hacker mũ trắng
KHÓA HỌC LẬP TRÌNH PYTHON TỪ CƠ BẢN ĐẾN CHUYÊN NGHIỆP

Khóa học Lập trình Visual Foxpro 9 - Dành cho nhà quản lý và kế toán

Khóa học hướng dẫn về Moodle chuyên nghiệp và hay
Xây dựng hệ thống đào tạo trực tuyến chuyên nghiệp tốt nhất hiện nay.



Khóa học AutoIt dành cho dân IT và Marketing chuyên nghiệp

Khoá học Word từ cơ bản tới nâng cao, học nhanh, hiểu sâu


Khóa học hướng dẫn sử dụng Powerpoint từ đơn giản đến phức tạp HIỆU QUẢ
Khóa học Thiết kế, quản lý dữ liệu dự án chuyên nghiệp cho doanh nghiệp bằng Bizagi
Khoa hoc hay
Khóa học Phân tích dữ liệu sử dụng Power Query trong Excel

Khóa học Lập trình WEB bằng PHP từ cơ bản đến nâng cao

Khóa học Phân tích dữ liệu sử dụng TableAU - Chìa khóa thành công!
Nhấn vào đây để bắt đầu khóa học


Khóa học Phân tích dữ liệu sử dụng SPSS - Chìa khóa thành công!


Khóa học "Thiết kế bài giảng điện tử", Video, hoạt hình 
kiếm tiền Youtube bằng phần mềm Camtasia Studio
Khóa học HƯỚNG DẪN THIẾT KẾ VIDEO CLIP CHO DÂN MARKETING CHUYÊN NGHIỆP
Xây dựng website​​​​
HƯỚNG DẪN THIẾT KẾ QUẢNG CÁO VÀ ĐỒ HỌA CHUYÊN NGHIỆP VỚI CANVA
Hãy tham gia khóa học để trở thành người chuyên nghiệp. Tuyệt HAY!😲👍
Khoa hoc hay
MICROSOFT ACCESS



GOOGLE SPREADSHEETS phê không tưởng
Khoa hoc hay
Khóa hoc lập trình bằng Python tại đây

Hãy tham gia khóa học để biết mọi thứ

Để tham gia tất cả các bài học, Bạn nhấn vào đây 

Khóa học lập trình cho bé MSWLogo
Nhấn vào đây để bắt đầu học
Nhấn vào đây để bắt đầu học


Khóa học Ba, Mẹ và Bé - Cùng bé lập trình  TUYỆT VỜI

Khoa hoc hay

Khóa học sử dụng Adobe Presenter-Tạo bài giảng điện tử
Khoa hoc hay
Design Website

Để thành thạo Wordpress bạn hãy tham gia khóa học 
Khóa học sử dụng Edmodo để dạy và học hiện đại để thành công
==***==
Bảo hiểm nhân thọ - Bảo vệ người trụ cột
Cập nhật công nghệ từ Youtube tại link: congnghe.hocviendaotao.com
Tham gia nhóm Facebook
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com

Nguồn: Tinh Tế

About Học viện đào tạo trực tuyến

Xinh chào bạn. Tôi là Đinh Anh Tuấn - Thạc sĩ CNTT. Email: dinhanhtuan68@gmail.com .
- Nhận đào tạo trực tuyến lập trình dành cho nhà quản lý, kế toán bằng Foxpro, Access 2010, Excel, Macro Excel, Macro Word, chứng chỉ MOS cao cấp, IC3, tiếng anh, phần mềm, phần cứng .
- Nhận thiết kế phần mềm quản lý, Web, Web ứng dụng, quản lý, bán hàng,... Nhận Thiết kế bài giảng điện tử, số hóa tài liệu...
HỌC VIỆN ĐÀO TẠO TRỰC TUYẾN:TẬN TÂM-CHẤT LƯỢNG.
«
Next
Bài đăng Mới hơn
»
Previous
Bài đăng Cũ hơn