
AI tạo sinh làm rất tốt một việc, đó là tạo ra những văn bản ngôn ngữ tự nhiên, nhìn cứ như con người viết ra nhờ cách vận hành của mô hình ngôn ngữ. Tuy nhiên, có hai nghiên cứu độc lập vừa được thực hiện đã đi đến kết luận rằng, sức hút và những quảng cáo về khả năng của AI tạo sinh có thể đã bị thổi phồng.
Một nghiên cứu đã chứng minh được rằng, AI tạo sinh gặp khó khăn trong việc hiểu những văn bản dài như những cuốn sách. Nghiên cứu còn lại thì chỉ ra rằng, những mô hình ngôn ngữ AI tạo sinh gặp khó khăn trong quá trình tạo ra những câu trả lời dựa trên dữ liệu đầu vào là những đoạn video. Đây là thử thách mà các công ty ứng dụng mô hình cũng như giải pháp AI nên để tâm nếu muốn ứng dụng những mô hình tạo sinh.
Đối với những người làm việc sáng tạo hiện tại, không ít người lo ngại về việc AI tạo sinh đã và đang thay thế cho công việc của họ. Những người làm copywriter tự do, làm việc hợp đồng cho các đơn vị và doanh nghiệp đang biến mất dần, cơ bản vì chính bản thân doanh nghiệp nhờ cậy tới công nghệ AI tạo sinh để làm những công việc tạo văn bản hay nội dung, tiết kiệm cả thời gian lẫn chi phí vận hành.
Nhưng những chatbot AI vận hành dựa trên mô hình ngôn ngữ tạo sinh luôn có giới hạn. Cả hai nghiên cứu kể trên đều xác định khả năng của AI tạo sinh trong quá trình phân tích lượng dữ liệu với dung lượng lớn. Cụ thể hơn, một cuộc nghiên cứu phân tích khả năng của những mô hình ngôn ngữ hiểu và viết tiếp những câu chuyện dài, xác định khả năng tổng hợp và tóm tắt thông tin, rồi xây dựng văn bản dựa trên những gì đã được đưa vào mô hình. Cuộc nghiên cứu còn lại thì tập trung vào đánh giá hiệu năng của những mô hình ngôn ngữ thị giác.
Cả hai cuộc nghiên cứu đều phát hiện ra, những mô hình AI hiện giờ đều có giới hạn, bao gồm cả Gemini phiên bản mới nhất của Google, thứ mà tập đoàn Alphabet đã nhấn mạnh vào khả năng xử lý lượng dữ liệu lớn khi giới thiệu.
Một nghiên cứu đã chứng minh được rằng, AI tạo sinh gặp khó khăn trong việc hiểu những văn bản dài như những cuốn sách. Nghiên cứu còn lại thì chỉ ra rằng, những mô hình ngôn ngữ AI tạo sinh gặp khó khăn trong quá trình tạo ra những câu trả lời dựa trên dữ liệu đầu vào là những đoạn video. Đây là thử thách mà các công ty ứng dụng mô hình cũng như giải pháp AI nên để tâm nếu muốn ứng dụng những mô hình tạo sinh.
Đối với những người làm việc sáng tạo hiện tại, không ít người lo ngại về việc AI tạo sinh đã và đang thay thế cho công việc của họ. Những người làm copywriter tự do, làm việc hợp đồng cho các đơn vị và doanh nghiệp đang biến mất dần, cơ bản vì chính bản thân doanh nghiệp nhờ cậy tới công nghệ AI tạo sinh để làm những công việc tạo văn bản hay nội dung, tiết kiệm cả thời gian lẫn chi phí vận hành.
Nhưng những chatbot AI vận hành dựa trên mô hình ngôn ngữ tạo sinh luôn có giới hạn. Cả hai nghiên cứu kể trên đều xác định khả năng của AI tạo sinh trong quá trình phân tích lượng dữ liệu với dung lượng lớn. Cụ thể hơn, một cuộc nghiên cứu phân tích khả năng của những mô hình ngôn ngữ hiểu và viết tiếp những câu chuyện dài, xác định khả năng tổng hợp và tóm tắt thông tin, rồi xây dựng văn bản dựa trên những gì đã được đưa vào mô hình. Cuộc nghiên cứu còn lại thì tập trung vào đánh giá hiệu năng của những mô hình ngôn ngữ thị giác.
Cả hai cuộc nghiên cứu đều phát hiện ra, những mô hình AI hiện giờ đều có giới hạn, bao gồm cả Gemini phiên bản mới nhất của Google, thứ mà tập đoàn Alphabet đã nhấn mạnh vào khả năng xử lý lượng dữ liệu lớn khi giới thiệu.
Lấy ví dụ, Gemini 1.5 Flash có thể xác định 1.5 tiếng đồng hồ dữ liệu video, 11 tiếng dữ liệu audio, hoặc hơn 700 nghìn từ chỉ trong một câu lệnh, theo quảng cáo của Google. Trong một màn trình diễn trước báo giới, Google mô tả cách Gemini 1.5 Flash xử lý một đoạn video dài 14 phút chỉ trong vòng 1 phút đồng hồ. Nhưng khả năng nắm bắt ngữ cảnh, ít nhất là ở khía cạnh dữ liệu văn bản dài, thì khó đánh giá hơn. Theo Marzena Karpinska, đồng chủ biên một trong hai cuộc nghiên cứu: "Trong khi những mô hình như Gemini 1.5 Pro trên lý thuyết có thể xử lý dữ liệu với ngữ cảnh dài và phức tạp, chúng tôi lại thấy không ít trường hợp chi thấy mô hình không thực sự hiểu rõ nội dung của dữ liệu đầu vào."
Cô Karpinska cùng những nhà nghiên cứu tại viện nghiên cứu AI thuộc trường đại học Allen và đại học Princeton đã "hỏi" mô hình ngôn ngữ xác định những tuyên bố đúng sai về những cuốn sách hư cấu gần đây, và những chi tiết quan trọng trong cốt truyện của những cuốn sách này.
Với một cuốn sách khoảng 260 nghìn từ, tức 520 trang, các nhà nghiên cứu phát hiện ra Gemini 1.5 Pro chỉ trả lời đúng 46.7% tổng số những câu hỏi đúng sai, còn Gemini Flash chỉ trả lời đúng có 20% mà thôi. Còn GPT-4 đạt mức độ chính xác cao nhất trong số những mô hình AI tạo sinh được đem ra thử nghiệm, nhưng cũng chỉ có 55.8% số câu trả lời đúng mà thôi. Nghiên cứu này cũng phát hiện ra rằng cách giải thích cho câu trả lời mà mô hình AI đưa ra đều không chính xác.
Cô Karpinska cho biết: "Chúng tôi nhận thấy những mô hình AI gặp khó khăn trong việc xác định đúng sai của những tuyên bố cần "đọc" và "tổng hợp" lượng nội dung lớn trong một cuốn sách. Còn những bằng chứng được tổng hợp chỉ trong một hoặc một vài câu, thì AI đưa ra kết luận vừa nhanh vừa đúng. Chúng tôi cũng nhận ra những mô hình này gặp khó khăn trong việc xác định những tuyên bố không được viết cụ thể trong các đoạn văn, nhưng trong mắt người đọc sách, ý của chúng được đề cập khá rõ ràng."
Còn trong khi đó, với cuộc nghiên cứu thứ hai, các nhà nghiên cứu phát hiện ra trong nhiều nhiệm vụ, bao gồm tư duy toán học, trả lời câu hỏi với dữ kiện hình ảnh và nhận diện nhân vật, những mô hình nhận diện ngôn ngữ hình ảnh đều gặp khó khăn, nhất là khi dữ liệu đầu vào là video có thời lượng dài. Nói chung, những mô hình nhận diện ngôn ngữ cao cấp nhất hiện nay đều gặp khó khăn trong việc lờ đi những thông tin không liên quan khi trả lời những câu hỏi của con người, khi chúng gặp phải window context, tức lượng thông tin ngữ cảnh quá lớn.
Đồng chủ biên cuộc nghiên cứu thứ hai, Michael Saxon, nghiên cứu sinh tại đại học UC Santa Barbara nói rằng: "Với những nhiệm vụ trả lời câu hỏi dựa trên dữ liệu hình ảnh, những mô hình chúng tôi thử nghiệm đều gặp khó khăn. Yêu cầu bắt mô hình AI phải thực hiện bước xử lý tư duy, nhận diện những con số trong một khung hình video, và đọc con số đó ra, là thứ khiến mô hình AI trục trặc."
Với cuộc nghiên cứu thứ hai, Gemini 1.5 Flash cũng không hoàn thành nhiệm vụ tốt cho lắm, trong một slide 25 tấm hình, yêu cầu nó nhận diện con số trong hình, nó chỉ đọc đúng thông tin từ 50% số hình ảnh ban đầu, và khi yêu cầu nhận diện con số với 8 chữ số, mô hình AI của Google chỉ đúng có 30%.
Theo Techspot
Quảng cáo
==***==
==***==
Nơi hội tụ Tinh Hoa Tri Thức - Khơi nguồn Sáng tạo
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com
---
Khóa học Hacker và Marketing từ A-Z trên ZALO!
Khóa học Hacker và Marketing từ A-Z trên Facebook!
Bảo mật và tấn công Website - Hacker mũ trắng
KHÓA HỌC LẬP TRÌNH PYTHON TỪ CƠ BẢN ĐẾN CHUYÊN NGHIỆP
Khóa học Lập trình Visual Foxpro 9 - Dành cho nhà quản lý và kế toán
Khóa học hướng dẫn về Moodle chuyên nghiệp và hay Xây dựng hệ thống đào tạo trực tuyến chuyên nghiệp tốt nhất hiện nay.
Khóa học AutoIt dành cho dân IT và Marketing chuyên nghiệp
Khoá học Word từ cơ bản tới nâng cao, học nhanh, hiểu sâu
Khóa học hướng dẫn sử dụng Powerpoint từ đơn giản đến phức tạp HIỆU QUẢ Khóa học Thiết kế, quản lý dữ liệu dự án chuyên nghiệp cho doanh nghiệp bằng Bizagi Khóa học Phân tích dữ liệu sử dụng Power Query trong Excel
Khóa học Lập trình WEB bằng PHP từ cơ bản đến nâng cao
Khóa học "Thiết kế bài giảng điện tử", Video, hoạt hình kiếm tiền Youtube bằng phần mềm Camtasia Studio Khóa học HƯỚNG DẪN THIẾT KẾ VIDEO CLIP CHO DÂN MARKETING CHUYÊN NGHIỆP HƯỚNG DẪN THIẾT KẾ QUẢNG CÁO VÀ ĐỒ HỌA CHUYÊN NGHIỆP VỚI CANVA Hãy tham gia khóa học để trở thành người chuyên nghiệp. Tuyệt HAY!😲👍
GOOGLE SPREADSHEETS phê không tưởng Hãy tham gia khóa học để biết mọi thứ
Khóa học sử dụng Adobe Presenter-Tạo bài giảng điện tử
Để thành thạo Wordpress bạn hãy tham gia khóa học Khóa học sử dụng Edmodo để dạy và học hiện đại để thành công ==***== Bảo hiểm nhân thọ - Bảo vệ người trụ cột Cập nhật công nghệ từ Youtube tại link: congnghe.hocviendaotao.com
Tham gia nhóm Facebook
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com
Bảo mật và tấn công Website - Hacker mũ trắng
KHÓA HỌC LẬP TRÌNH PYTHON TỪ CƠ BẢN ĐẾN CHUYÊN NGHIỆP

Khóa học AutoIt dành cho dân IT và Marketing chuyên nghiệp
Khoá học Word từ cơ bản tới nâng cao, học nhanh, hiểu sâu
Khóa học hướng dẫn sử dụng Powerpoint từ đơn giản đến phức tạp HIỆU QUẢ
Khóa học Thiết kế, quản lý dữ liệu dự án chuyên nghiệp cho doanh nghiệp bằng Bizagi
Khóa học Phân tích dữ liệu sử dụng Power Query trong Excel
Khóa học Lập trình WEB bằng PHP từ cơ bản đến nâng cao
kiếm tiền Youtube bằng phần mềm Camtasia Studio
Khóa học HƯỚNG DẪN THIẾT KẾ VIDEO CLIP CHO DÂN MARKETING CHUYÊN NGHIỆP
HƯỚNG DẪN THIẾT KẾ QUẢNG CÁO VÀ ĐỒ HỌA CHUYÊN NGHIỆP VỚI CANVA
Hãy tham gia khóa học để trở thành người chuyên nghiệp. Tuyệt HAY!😲👍
GOOGLE SPREADSHEETS phê không tưởng
Hãy tham gia khóa học để biết mọi thứ
Khóa học sử dụng Adobe Presenter-Tạo bài giảng điện tử
Để thành thạo Wordpress bạn hãy tham gia khóa học
Khóa học sử dụng Edmodo để dạy và học hiện đại để thành công
==***==
Bảo hiểm nhân thọ - Bảo vệ người trụ cột
Tham gia nhóm Facebook
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com
Nguồn: Tinh Tế
Topics: Công nghệ mới


































