Header ads

Header ads
» »

Google IO 2024: AI tạo video, AI nói chuyện với người, nhìn và hiểu thế giới thật, phát hiện lừa đảo

Tại sự kiện I/O 2024 đang diễn ra, AI là trọng tâm của hầu hết các sản phẩm, công nghệ mới mà Google cung cấp. Bằng việc ra mắt các model mới với số lượng tham số lớn, các model nhỏ dành cho các tác vụ ơn Device tích hợp sẵn vào máy, tích hợp rất sâu AI vào lõi Android,… chúng ta có sự xuất hiện của AI gần như ở mọi tác vụ mà con người đang tương tác với smartphone, máy tính và cả nội dung số nói chung.

Với lương thiết bị sẵn có và chắc chắn sẽ được làm mới bởi các hệ sinh thái những OEM, các tính năng AI này hứa hẹn sẽ sớm được xuất hiện và len lỏi vào mọi ngóc ngách của cuộc sống số con người trong không lâu nữa.

Bên cạnh đó, những dự án mới như Astra cho phép AI nhìn và nghe toàn bộ môi trường ngoài đời thật hay Veo - Gen AI với khả năng tạo và chỉnh sửa các video FullHD dài tận 1 phút cũng là những điểm đáng chú ý về đột phá trong lĩnh vực AI của Google.

Gemma 2 phiên bản mới với 27 tỷ tham số

[​IMG]


Đáp lại yêu cầu của các nhà phát triển, Google đã nâng cấp model Gemma phiên bản mới với 27 tỷ tham số so với hiện tại. Model mới sẽ được chính thức phát hành vào tháng 6 sắp tới. Google cho biết model sẽ được tối ưu hóa bởi NVIDIA để chạy trên các GPU thế hệ mới của công ty, đồng thời có thể chạy hiệu quả trên host 1 TPU và vertex AI.

Google IO24 Tinhte -07.jpg

Tích hợp sâu AI trong lõi Android mới


Google cho biết từ giờ, các thế hệ Android mới sẽ được tích hợp sẵn AI từ tầng lõi của OS, cho phép các tính năng sử dụng trí thông minh nhân tạo, đặc biệt là on device được hoạt động hiệu quả và mạnh mẽ hơn. Một thí dụ được họ đưa ra là với AI, chúng ta sẽ có thể tìm kiếm những hình ảnh nằm trong Google Photos theo một cách hoàn toàn mới.

8334735-Screenshot-2024-05-15-000707.webp

Thay vì search và sử dụng việc nhận diện vật thể trong hình ảnh để trả về kết quả như trước đây, bây giờ chúng ta có thể dùng ngôn ngữ tự nhiên để hỏi thông tin trong hình, thí dụ như search bản số xe của tôi,... Tương tự, chỉ cần người dùng gõ "quá trình tập bơi của con tôi", Google Photos sẽ trả về toàn bộ các hình ảnh trong quá trình tập bơi mà người dùng đã từng chụp lại, sắp xếp theo thứ tự luôn.

Google IO24 Tinhte -03.jpg

Một tính năng khác là cảnh báo ngay khi người dùng đang nghe một cuộc gọi lừa đảo. Không chặn hẳn số, nhưng trong cuộc điện thoại mà kẻ xấu gọi với mục đích lừa đảo, Android sẽ nhận diện và hiện cảnh báo ngay trong cuộc gọi để người dùng nhận biết, thí dụ như "Ngân hàng không bao giờ yêu cầu bạn chuyển tiền để giữ nó an toàn,....". Tính năng này hoạt động đựa trên Gemini Nano - model gen AI nhỏ nhất của AI, chạy hoàn toàn trên máy không cần mạng và có khả năng nhận diện dấu hiệu lừa đảo trong nội dung cuộc hội thoại theo thời gian thực.

Thêm một tính năng khác, Gemini sẽ dần thay thế Google Assistant, sớm hỗ trợ thêm các tính năng tương tác sâu hơn với từng nhu cầu của người dùng. Thí dụ như người dùng có thể kéo thả các hình ảnh tạo bằng AI vào Gmail, Message hoặc các app khác, đồng thời, Gemini sẽ có thể "đọc" ngữ cảnh mà người dùng đang xài trên màn hình thí dụ như đang coi video, người dùng chỉ cần đặt câu hỏi tự nhiên, hệ thống sẽ tự biết người dùng đang muốn hỏi nội dung trong video, AI lúc này sẽ tự mò vào đó và lấy thông tin ra,...

Quảng cáo



Google Maps cũng sẽ được bổ sung thêm tính năng thông minh nhờ vào Gemini và API Places. Dựa vào đây, các nhà phát triển có thể dùng gen AI để tóm tắt thông tin các địa điểm và khu vực trong ứng dụng của họ. Các tóm tắt này có được nhờ Gemini phân tích insight từ cộng đồng 300 triệu đánh giá các địa điểm. Nhờ đó, các nhà phát triển không cần tự viết mô tả về các địa điểm họ muốn nhúng vào trong app nữa.

Google IO24 Tinhte -09.jpg

Tính năng Circle to Search sẽ là điểm nhấn AI trên Android trong thời gian tới. Người dùng chỉ cần giữ nút home, chọn vật thể trong hình để tìm kiếm và kết quả sẽ được trả về. Tính năng này đã được Samsung giới thiệu cùng với Galaxy S24 Ultra trước đây trên OneUI 6.1. Tuy nhiên việc Google chính thức tích hợp sâu vào ngay Android sẽ giúp phổ cập hóa tính năng hữu ích này cho toàn bộ các máy khác trong thế giới Android. Không chỉ để tìm kiếm vật thể hay các vấn đề trong hình, tính năng này còn có thể dùng như một công cụ gia sư cho học sinh. Trẻ em chỉ cần chĩa camera vào và chọn bài tập cần trợ giúp, AI sẽ nhận diện text, hình ảnh và đưa ra gợi ý như một gia sư. Cái này đáng giá quá chừng nè.

Gemini xuất hiện ở hầu hết các dịch vụ của Google

Gemini 1.5 Pro

Google IO24 Tinhte -11.jpg


Đầu tiên là cập nhật lớn của model gen AI Gemini phiên bản 1.5. Ở phiên bản này, Gemini đã có thể phân tích các văn bản dài, các đoạn code, video, đoạn ghi âm,... với thời lượng dài. Trong demo, Google đã thử cho Gemini phân tích một file văn bản code với độ lớn lên tới hơn 2 triệu token, yêu cầu nó tìm lỗi và đưa ra gợi ý. Mình có thử tại chỗ và nó chạy nhanh thật. Hiện tại các model Gemini 1.5 flash và Gemini 1.5 Pro đã được cho dùng đại trà trong Google AI Studio, phiên bản 1.5 Pro 2 triệu Token thì đang nhận waitlist.

Quảng cáo


Gemini Live

Google IO24 Tinhte -05.jpg


Đây là tính năng cho phép người dùng hội thoại bằng giọng nói tự nhiên với Gemini ngay trên smartphone. Cách trò chuyện không chỉ là đợi lần lượt hết bên này tới bên kia mà người dùng có thể cắt ngang bất cứ lúc nào để làm rõ câu hỏi, hỏi một ý mà AI vừa nói và Gemini sẽ nhận diện để phản ứng ngay lập tức. Không chỉ nghe, Gemini còn có thể nhìn, nó có thể nhìn thấy, phân tích và đưa ra thông tin phản hồi khi người dùng chĩa camera vào. Trong demo, Gemini còn thể hiện được "trí nhớ" khi nó có thể trả lời được vị trí của một món đồ mà nó "nhìn thấy" trước đó.

Gemini Nano

8334741-Screenshot-2024-05-15-001339.webp


Đây là model kích thước nhỏ nhất, được Google tích hợp thẳng vào Chome trên desktop từ phiên bản 126. Google cho biết Gemini Nano sẽ cho phép các nhà phát triển có thể khai thác các tính năng AI ở dạng on device cho người dùng. Trước mắt, model này cho phép Chrome có thể chạy các tính năng hỗ trợ từ Workspace Lab trong mail,…

Gemini làm việc sâu hơn trong Google Search


Đây có lẽ là cái sẽ tác động tới người dùng nhiều nhất trong tương lai. Nếu như gần 1 năm qua Google đã đôi khi hiện các thông tin từ Gemini trên khung kết quả khi người dùng tìm kiếm gì đó, thì bây giờ sự xuất hiện của Gemini sẽ nhiều hơn và hiệu quả hơn. Nhờ vào lượng context windows lớn nhất của mô hình mà công ty đang đào tạo, Gemini tích hợp sâu trong Chrome không chỉ đơn thuần là trả về thông tin được AI tổng hợp lại (tất nhiên là kèm theo đường link kiểm chứng), mà nó còn can thiệp vào nhiều việc hơn, thí dụ như sắp xếp lịch trình chuyến đi, trả lời các truy vấn dưới nhiều hình thức hơn, nhiều gợi ý dựa trên từ khóa tìm kiếm của người dùng hơn.

AI tạo ảnh Gemini Imagen 3

8334758-Screenshot-2024-05-15-003028.webp


Bên cạnh đó, Google hôm nay cũng chính thức ra mắt công cụ tạo ảnh bằng AI - Imagen thế hệ thứ 3 với khả năng hiểu được chính xác hơn câu prompt từ người dùng để chuyển thành hình ảnh đúng ý hơn. Google nói rằng công cụ mới sẽ có "độ sáng tạo và chi tiết" cao hơn so với thế hệ trước, đồng thời giảm thiểu các artifacts hoặc lỗi khi tạo ảnh. Đồng thời, Google tuyên bố Imagen 3 cũng là model tạo ảnh có hiệu quả tạo text trên hình ảnh tốt nhất (về cơ bản thì đây là điểm yếu của hầu hết các model tạo ảnh bằng AI trước giờ).

Veo - câu trả lời của Google đối với Sora của OpenAI

Google IO24 Tinhte -04.jpg


Tại sự kiện, Google đã chính thức nói về gen AI tạo video do công ty phát triển. Model này có thể tạo ra đoạn video độ phân giải 1080p thời lượng khoảng 1 phút chỉ với 1 câu prompt. Tất nhiên, Veo sẽ hỗ trợ những style và phong cách điện ảnh khác nhau, các cú máy khác nhau, tùy vào nhu cầu của người dùng,.... Đáng chú ý hơn, Veo cho phép người dùng edit và điều chỉnh những đoạn video đã được tạo ra trước đó.

Firebase Genkit

Platform Firebase cũng được Google bổ sung thêm tính năng gọi là Firebase Genkit, giúp các nhà phát triển có thể dễ dàng build các ứng dụng AI bằng JavaScript / TypeScript, hỗ trợ Go. Đây là một framework mã nguồn mở, sử dụng license Apache 2.0. Tại sự kiện, Google đã demo một số ứng dụng dùng framework này để tích hợp các tính năng tóm tắt văn bản, dịch và tạo hình ảnh.


Giá của API


Google IO24 Tinhte -01.jpg

Gemini 1.5 Flash chỉ có giá 0.35 đô cho 1 triệu token (rẻ hơn rất nhiều so với mức giá 5 đô cho 1 triệu token của GPT-4). Đồng thời Google cho biết đang có kế hoạch mở rộng quy mô của nền tảng Gemma 2. Mức chi phí này giúp cho các lập trình viên dễ thở hơn trong việc nghiên cứu và phát triển các ứng dụng AI. Đồng thời nó cũng cho thấy nỗ lực của Google trong việc "bình dân học vụ AI", giúp những tiềm năng của nó tiếp cận được tới nhiều người dùng hơn trên toàn cầu.

Khóa học Machine Learning cơ bản- Khoa học dữ liệu - AI
==***==

Khoá học Quản trị Chiến lược Dành cho Lãnh đạo Doanh nghiệp

Nhấn vào đây để bắt đầu khóa học

==***==
Nơi hội tụ Tinh Hoa Tri Thức - Khơi nguồn Sáng tạo
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com
--- 

Khóa học Hacker và Marketing từ A-Z trên ZALO!

Khóa học Hacker và Marketing từ A-Z trên Facebook!

Khóa đào tạo Power BI phân tích báo cáo để bán hàng thành công

Bảo mật và tấn công Website - Hacker mũ trắng
Hacker mũ trắng
KHÓA HỌC LẬP TRÌNH PYTHON TỪ CƠ BẢN ĐẾN CHUYÊN NGHIỆP

Khóa học Lập trình Visual Foxpro 9 - Dành cho nhà quản lý và kế toán

Khóa học hướng dẫn về Moodle chuyên nghiệp và hay
Xây dựng hệ thống đào tạo trực tuyến chuyên nghiệp tốt nhất hiện nay.



Khóa học AutoIt dành cho dân IT và Marketing chuyên nghiệp

Khoá học Word từ cơ bản tới nâng cao, học nhanh, hiểu sâu


Khóa học hướng dẫn sử dụng Powerpoint từ đơn giản đến phức tạp HIỆU QUẢ
Khóa học Thiết kế, quản lý dữ liệu dự án chuyên nghiệp cho doanh nghiệp bằng Bizagi
Khoa hoc hay
Khóa học Phân tích dữ liệu sử dụng Power Query trong Excel

Khóa học Lập trình WEB bằng PHP từ cơ bản đến nâng cao

Khóa học Phân tích dữ liệu sử dụng TableAU - Chìa khóa thành công!
Nhấn vào đây để bắt đầu khóa học


Khóa học Phân tích dữ liệu sử dụng SPSS - Chìa khóa thành công!


Khóa học "Thiết kế bài giảng điện tử", Video, hoạt hình 
kiếm tiền Youtube bằng phần mềm Camtasia Studio
Khóa học HƯỚNG DẪN THIẾT KẾ VIDEO CLIP CHO DÂN MARKETING CHUYÊN NGHIỆP
Xây dựng website​​​​
HƯỚNG DẪN THIẾT KẾ QUẢNG CÁO VÀ ĐỒ HỌA CHUYÊN NGHIỆP VỚI CANVA
Hãy tham gia khóa học để trở thành người chuyên nghiệp. Tuyệt HAY!😲👍
Khoa hoc hay
MICROSOFT ACCESS



GOOGLE SPREADSHEETS phê không tưởng
Khoa hoc hay
Khóa hoc lập trình bằng Python tại đây

Hãy tham gia khóa học để biết mọi thứ

Để tham gia tất cả các bài học, Bạn nhấn vào đây 

Khóa học lập trình cho bé MSWLogo
Nhấn vào đây để bắt đầu học
Nhấn vào đây để bắt đầu học


Khóa học Ba, Mẹ và Bé - Cùng bé lập trình  TUYỆT VỜI

Khoa hoc hay

Khóa học sử dụng Adobe Presenter-Tạo bài giảng điện tử
Khoa hoc hay
Design Website

Để thành thạo Wordpress bạn hãy tham gia khóa học 
Khóa học sử dụng Edmodo để dạy và học hiện đại để thành công
==***==
Bảo hiểm nhân thọ - Bảo vệ người trụ cột
Cập nhật công nghệ từ Youtube tại link: congnghe.hocviendaotao.com
Tham gia nhóm Facebook
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com

Nguồn: Tinh Tế

About Học viện đào tạo trực tuyến

Xinh chào bạn. Tôi là Đinh Anh Tuấn - Thạc sĩ CNTT. Email: dinhanhtuan68@gmail.com .
- Nhận đào tạo trực tuyến lập trình dành cho nhà quản lý, kế toán bằng Foxpro, Access 2010, Excel, Macro Excel, Macro Word, chứng chỉ MOS cao cấp, IC3, tiếng anh, phần mềm, phần cứng .
- Nhận thiết kế phần mềm quản lý, Web, Web ứng dụng, quản lý, bán hàng,... Nhận Thiết kế bài giảng điện tử, số hóa tài liệu...
HỌC VIỆN ĐÀO TẠO TRỰC TUYẾN:TẬN TÂM-CHẤT LƯỢNG.
«
Next
Bài đăng Mới hơn
»
Previous
Bài đăng Cũ hơn