
Microsoft tuyên bố đã hoàn tất quá trình phát triển phiên bản thứ 2 của model AI với khả năng nhái giọng nói của con người chỉ với 3 giây thu âm VALL-E. Theo nhóm nghiên cứu từ Microsoft, VALL-E 2 hiện đang không an toàn để phát hành bởi công cụ này hiện đã có khả năng mô phỏng giọng nói con người quá giống thật. Microsoft cho biết hiện nó mới chỉ được cung cấp để phục vụ nghiên cứu.
Chi tiết hơn xíu, VALL-E 2 là một mô hình ngôn ngữ codec neural, một cách tiếp cận deep learning dùng các kỹ thuật mạng neural để mã hóa và giải mã thông tin ngôn ngữ. Tuy nhiên, không giống như VALL-E, VALL-E 2 có thể tổng hợp văn bản thành giọng nói (TTS), sử dụng đầu vào văn bản để tạo giọng nói cho giọng nói mà nó chưa được đào tạo trước đó.
Để làm được chuyện đó, Microsoft đã sử dụng một thư viện đào tạo cực lớn chính là LibriSpeech và VCTK để ánh xạ các đầu vào văn bản thành các đầu ra định dạng file âm thanh tương ứng. Quá trình mapping còn có thể tạo ra các biến thể của một cách phát âm, ngữ điệu, nhịp và nhiều đặc điểm khác của giọng nói.
Sau khi "nghe" một đoạn clip ngắn về bài phát biểu của ai đó và kết hợp với prompt đầu vào bằng văn bản của người dùng, VALL-E 2 sẽ đưa các đặc điểm giọng nói đấy vào để bắt bước giọng nói của mẫu đưa vào và sau đó dùng giọng nói vừa tạo ra để tạo nên một đoạn nói chuyện với nội dung là text đưa vào một cách hoàn chỉnh.
Trước giờ, dù đã có nhiều model tạo giọng nói từ văn bản được giới thiệu nhưng phần lớn vẫn cho cảm giác là máy, kém tự nhiên và dễ nhận thấy là do máy tạo. Tuy nhiên với nghiên cứu mới này của Microsoft thì VALL-E 2 đã có thể tạo ra đoạn nói chuyện mượt mà, tự nhiên, có nhấn nhá và thậm chí biểu đạt được cảm xúc tức thời như con người.
Dù vậy, có ý kiến cho rằng việc đưa cho AI khả năng này đã "phần nào đạt được như con người", có thể sẽ tạo nên những bất cập hơn là lợi ích. Microsoft nói rằng hiện VALL-E 2 chỉ phục vụ mục đích nghiên cứu và chưa có kế hoạch đưa nó vào sản phẩm hoặc mở rộng việc sử dụng cho cộng đồng.
Đồng thời, nhóm nghiên cứu nói rằng VALL-E 2 có thể phục vụ các nhu cầu đặc biệt như giáo dục hoặc giải trí, trong đó model AI tạo giọng nói sẽ có thể trình bày các bài giảng online, đọc các quyển sách với giọng nói tự nhiên như con người.
Chi tiết hơn xíu, VALL-E 2 là một mô hình ngôn ngữ codec neural, một cách tiếp cận deep learning dùng các kỹ thuật mạng neural để mã hóa và giải mã thông tin ngôn ngữ. Tuy nhiên, không giống như VALL-E, VALL-E 2 có thể tổng hợp văn bản thành giọng nói (TTS), sử dụng đầu vào văn bản để tạo giọng nói cho giọng nói mà nó chưa được đào tạo trước đó.
Để làm được chuyện đó, Microsoft đã sử dụng một thư viện đào tạo cực lớn chính là LibriSpeech và VCTK để ánh xạ các đầu vào văn bản thành các đầu ra định dạng file âm thanh tương ứng. Quá trình mapping còn có thể tạo ra các biến thể của một cách phát âm, ngữ điệu, nhịp và nhiều đặc điểm khác của giọng nói.
Sau khi "nghe" một đoạn clip ngắn về bài phát biểu của ai đó và kết hợp với prompt đầu vào bằng văn bản của người dùng, VALL-E 2 sẽ đưa các đặc điểm giọng nói đấy vào để bắt bước giọng nói của mẫu đưa vào và sau đó dùng giọng nói vừa tạo ra để tạo nên một đoạn nói chuyện với nội dung là text đưa vào một cách hoàn chỉnh.
Trước giờ, dù đã có nhiều model tạo giọng nói từ văn bản được giới thiệu nhưng phần lớn vẫn cho cảm giác là máy, kém tự nhiên và dễ nhận thấy là do máy tạo. Tuy nhiên với nghiên cứu mới này của Microsoft thì VALL-E 2 đã có thể tạo ra đoạn nói chuyện mượt mà, tự nhiên, có nhấn nhá và thậm chí biểu đạt được cảm xúc tức thời như con người.
Dù vậy, có ý kiến cho rằng việc đưa cho AI khả năng này đã "phần nào đạt được như con người", có thể sẽ tạo nên những bất cập hơn là lợi ích. Microsoft nói rằng hiện VALL-E 2 chỉ phục vụ mục đích nghiên cứu và chưa có kế hoạch đưa nó vào sản phẩm hoặc mở rộng việc sử dụng cho cộng đồng.
Đồng thời, nhóm nghiên cứu nói rằng VALL-E 2 có thể phục vụ các nhu cầu đặc biệt như giáo dục hoặc giải trí, trong đó model AI tạo giọng nói sẽ có thể trình bày các bài giảng online, đọc các quyển sách với giọng nói tự nhiên như con người.
==***==
==***==
Nơi hội tụ Tinh Hoa Tri Thức - Khơi nguồn Sáng tạo
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com
---
Khóa học Hacker và Marketing từ A-Z trên ZALO!
Khóa học Hacker và Marketing từ A-Z trên Facebook!
Bảo mật và tấn công Website - Hacker mũ trắng
KHÓA HỌC LẬP TRÌNH PYTHON TỪ CƠ BẢN ĐẾN CHUYÊN NGHIỆP
Khóa học Lập trình Visual Foxpro 9 - Dành cho nhà quản lý và kế toán
Khóa học hướng dẫn về Moodle chuyên nghiệp và hay Xây dựng hệ thống đào tạo trực tuyến chuyên nghiệp tốt nhất hiện nay.
Khóa học AutoIt dành cho dân IT và Marketing chuyên nghiệp
Khoá học Word từ cơ bản tới nâng cao, học nhanh, hiểu sâu
Khóa học hướng dẫn sử dụng Powerpoint từ đơn giản đến phức tạp HIỆU QUẢ Khóa học Thiết kế, quản lý dữ liệu dự án chuyên nghiệp cho doanh nghiệp bằng Bizagi Khóa học Phân tích dữ liệu sử dụng Power Query trong Excel
Khóa học Lập trình WEB bằng PHP từ cơ bản đến nâng cao
Khóa học "Thiết kế bài giảng điện tử", Video, hoạt hình kiếm tiền Youtube bằng phần mềm Camtasia Studio Khóa học HƯỚNG DẪN THIẾT KẾ VIDEO CLIP CHO DÂN MARKETING CHUYÊN NGHIỆP HƯỚNG DẪN THIẾT KẾ QUẢNG CÁO VÀ ĐỒ HỌA CHUYÊN NGHIỆP VỚI CANVA Hãy tham gia khóa học để trở thành người chuyên nghiệp. Tuyệt HAY!😲👍
GOOGLE SPREADSHEETS phê không tưởng Hãy tham gia khóa học để biết mọi thứ
Khóa học sử dụng Adobe Presenter-Tạo bài giảng điện tử
Để thành thạo Wordpress bạn hãy tham gia khóa học Khóa học sử dụng Edmodo để dạy và học hiện đại để thành công ==***== Bảo hiểm nhân thọ - Bảo vệ người trụ cột Cập nhật công nghệ từ Youtube tại link: congnghe.hocviendaotao.com
Tham gia nhóm Facebook
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com
Bảo mật và tấn công Website - Hacker mũ trắng
KHÓA HỌC LẬP TRÌNH PYTHON TỪ CƠ BẢN ĐẾN CHUYÊN NGHIỆP

Khóa học AutoIt dành cho dân IT và Marketing chuyên nghiệp
Khoá học Word từ cơ bản tới nâng cao, học nhanh, hiểu sâu
Khóa học hướng dẫn sử dụng Powerpoint từ đơn giản đến phức tạp HIỆU QUẢ
Khóa học Thiết kế, quản lý dữ liệu dự án chuyên nghiệp cho doanh nghiệp bằng Bizagi
Khóa học Phân tích dữ liệu sử dụng Power Query trong Excel
Khóa học Lập trình WEB bằng PHP từ cơ bản đến nâng cao
kiếm tiền Youtube bằng phần mềm Camtasia Studio
Khóa học HƯỚNG DẪN THIẾT KẾ VIDEO CLIP CHO DÂN MARKETING CHUYÊN NGHIỆP
HƯỚNG DẪN THIẾT KẾ QUẢNG CÁO VÀ ĐỒ HỌA CHUYÊN NGHIỆP VỚI CANVA
Hãy tham gia khóa học để trở thành người chuyên nghiệp. Tuyệt HAY!😲👍
GOOGLE SPREADSHEETS phê không tưởng
Hãy tham gia khóa học để biết mọi thứ
Khóa học sử dụng Adobe Presenter-Tạo bài giảng điện tử
Để thành thạo Wordpress bạn hãy tham gia khóa học
Khóa học sử dụng Edmodo để dạy và học hiện đại để thành công
==***==
Bảo hiểm nhân thọ - Bảo vệ người trụ cột
Tham gia nhóm Facebook
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com
Nguồn: Tinh Tế
Topics: Công nghệ mới


































