Header ads

Header ads
» » EnCodec: Thuật toán mã hóa sử dụng AI của Meta sẽ cho phép nén tín hiệu gấp 10 lần so với MP3

Hồi tuần trước, Meta vừa chính thức giới thiệu thuật toán nén âm thanh sử dụng trí tuệ nhân tạo mang tên EnCodec với hứa hẹn sở hữu hiệu năng gấp 10 lần so với MP3. EnCodec theo đó có thể nén âm thanh ở chất lượng 64kbps mà không làm ảnh hưởng đến chất lượng ban đầu, từ đó giúp tăng cường khả năng truyền tải với các kết nối băng thông thấp, ví dụ như gọi điện thoại hoặc dùng mạng ở những khu vực sóng yếu. Công nghệ này cũng có thể được áp dụng để nén nhạc.

Thuật toán EnCodec được Meta trình làng vào ngày 25/10 vừa qua trong dự án nghiên cứu nén âm thanh chất lượng cao "High Fidelity Neural Audio Compression" của các chuyên viên lĩnh vực AI của Meta gồm Alexandre Défossez, Jade Copet, Gabriel Synnaeve và Yossi Adi. Meta cũng đăng riêng một bài blog để giới thiệu kỹ hơn về EnCodec.

[​IMG]

Meta cho biết EnCodec là một hệ thống AI gồm 3 quy trình mã hóa (encoder), quantizer (xử lý nén) và decoder (giải mã) được huấn luyện để nén âm thanh đến một kích thước nhất định. Các bước gồm:
  1. Encoder sẽ chuyển đổi dữ liệu chưa nén thành các chuỗi dữ liệu tầng thấp (low-level structure) chuẩn bị được xử lý
  2. Quantizer sẽ nén các chuỗi dữ liệu tầng thấp để đạt được kích thước quy định, đồng thời tập trung vào các thành phần dữ liệu quan trọng nhất (dành cho quy trình giải nén về sau)
  3. Decoder sẽ giải nén dữ liệu thành tín hiệu âm thanh, xử lý hoàn toàn trong thời gian thực bằng mạng thần kinh nhân tạo (neural network) trên CPU.
tinhte-meta-encoder-3.jpg

Quảng cáo


Meta cho biết:

"Giải pháp tốt nhất dành cho nén lossy là nhận biết các thay đổi mà con người không thể cảm nhận được, ngoài ra không còn cách nào khác để tái tạo dữ liệu một cách hoàn hảo ở bitrate thấp hơn. Để thực hiện điều này, chúng tôi sử dụng các bộ lọc để phân biệt sự khác nhau trong các bản mẫu, cho phép AI học hỏi và phân biệt chính xác giữa các mẫu thật và mẫu đã được tái tạo lại. Thuật toán sẽ tạo ra các mẫu giả để đánh lừa bộ lọc từ đó càng giúp AI có thêm kiến thức để phân biệt chính xác hơn giữa các mẫu thật và mẫu đã được tái tạo".

tinhte-meta-encoder-4.jpg

Thuật toán ứng dụng mạng lưới thần kinh nhân tạo để nén và giải nén âm thanh nói chung không phải là quá mới mẻ, tuy nhiên nhóm nghiên cứu của Meta cho rằng họ là những người đầu tiên áp dụng công nghệ này cho âm thanh stereo 48kHz (cao hơn một chút so với chất lượng CD là 44.1 kHz), cũng là chất lượng đại trà hiện nay trên các dịch vụ stream nhạc.

Về mặt ứng dụng thực tế, Meta nói thuật toán "siêu nén âm thanh" bằng trí tuệ nhân tạo của mình sẽ giúp người dùng có được cuộc gọi trơn tru hơn ở những khu vực sóng yếu. Thêm vào đó, Meta còn cho biết EnCoder sẽ được ứng dụng sớm nhất vào Metaverse nhằm "cải thiện hơn nữa trải nghiệm đa phương tiện của người dùng mà không cần tiêu tốn quá nhiều băng thông".

EnCoder hiện vẫn đang trong giai đoạn nghiên cứu.

Nguồn arstechnica

CHUYÊN MỤC NGHỆ THUẬT LÀM GIÀU BỀN VỮNG
Khóa học Machine Learning cơ bản- Khoa học dữ liệu - AI
==***==

Khoá học Quản trị Chiến lược Dành cho Lãnh đạo Doanh nghiệp

Nhấn vào đây để bắt đầu khóa học

==***==
Nơi hội tụ Tinh Hoa Tri Thức - Khơi nguồn Sáng tạo
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com
--- 

Khóa học Hacker và Marketing từ A-Z trên ZALO!

Khóa học Hacker và Marketing từ A-Z trên Facebook!

Khóa đào tạo Power BI phân tích báo cáo để bán hàng thành công

Bảo mật và tấn công Website - Hacker mũ trắng
Hacker mũ trắng
KHÓA HỌC LẬP TRÌNH PYTHON TỪ CƠ BẢN ĐẾN CHUYÊN NGHIỆP

Khóa học Lập trình Visual Foxpro 9 - Dành cho nhà quản lý và kế toán

Khóa học hướng dẫn về Moodle chuyên nghiệp và hay
Xây dựng hệ thống đào tạo trực tuyến chuyên nghiệp tốt nhất hiện nay.



Khóa học AutoIt dành cho dân IT và Marketing chuyên nghiệp

Khoá học Word từ cơ bản tới nâng cao, học nhanh, hiểu sâu


Khóa học hướng dẫn sử dụng Powerpoint từ đơn giản đến phức tạp HIỆU QUẢ
Khóa học Thiết kế, quản lý dữ liệu dự án chuyên nghiệp cho doanh nghiệp bằng Bizagi
Khoa hoc hay
Khóa học Phân tích dữ liệu sử dụng Power Query trong Excel

Khóa học Lập trình WEB bằng PHP từ cơ bản đến nâng cao

Khóa học Phân tích dữ liệu sử dụng TableAU - Chìa khóa thành công!
Nhấn vào đây để bắt đầu khóa học


Khóa học Phân tích dữ liệu sử dụng SPSS - Chìa khóa thành công!


Khóa học "Thiết kế bài giảng điện tử", Video, hoạt hình 
kiếm tiền Youtube bằng phần mềm Camtasia Studio
Khóa học HƯỚNG DẪN THIẾT KẾ VIDEO CLIP CHO DÂN MARKETING CHUYÊN NGHIỆP
Xây dựng website​​​​
HƯỚNG DẪN THIẾT KẾ QUẢNG CÁO VÀ ĐỒ HỌA CHUYÊN NGHIỆP VỚI CANVA
Hãy tham gia khóa học để trở thành người chuyên nghiệp. Tuyệt HAY!😲👍
Khoa hoc hay
MICROSOFT ACCESS



GOOGLE SPREADSHEETS phê không tưởng
Khoa hoc hay
Khóa hoc lập trình bằng Python tại đây

Hãy tham gia khóa học để biết mọi thứ

Để tham gia tất cả các bài học, Bạn nhấn vào đây 

Khóa học lập trình cho bé MSWLogo
Nhấn vào đây để bắt đầu học
Nhấn vào đây để bắt đầu học


Khóa học Ba, Mẹ và Bé - Cùng bé lập trình  TUYỆT VỜI

Khoa hoc hay

Khóa học sử dụng Adobe Presenter-Tạo bài giảng điện tử
Khoa hoc hay
Design Website

Để thành thạo Wordpress bạn hãy tham gia khóa học 
Khóa học sử dụng Edmodo để dạy và học hiện đại để thành công
==***==
Bảo hiểm nhân thọ - Bảo vệ người trụ cột
Cập nhật công nghệ từ Youtube tại link: congnghe.hocviendaotao.com
Tham gia nhóm Facebook
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com

Nguồn: Tinh Tế

About Học viện đào tạo trực tuyến

Xinh chào bạn. Tôi là Đinh Anh Tuấn - Thạc sĩ CNTT. Email: dinhanhtuan68@gmail.com .
- Nhận đào tạo trực tuyến lập trình dành cho nhà quản lý, kế toán bằng Foxpro, Access 2010, Excel, Macro Excel, Macro Word, chứng chỉ MOS cao cấp, IC3, tiếng anh, phần mềm, phần cứng .
- Nhận thiết kế phần mềm quản lý, Web, Web ứng dụng, quản lý, bán hàng,... Nhận Thiết kế bài giảng điện tử, số hóa tài liệu...
HỌC VIỆN ĐÀO TẠO TRỰC TUYẾN:TẬN TÂM-CHẤT LƯỢNG.
«
Next
Bài đăng Mới hơn
»
Previous
Bài đăng Cũ hơn