Header ads

Header ads
» »

Thử 10 tình huống sử dụng AI Gemini Flash 2.0 để tạo và chỉnh sửa ảnh

Không chỉ có khả năng text to text mà model Gemini 2.0 còn có thể text to image, nghĩa là tạo ra hình ảnh từ văn bản nhập vào. Hồi cuối năm ngoái họ đã phát hành Gemini 2.0 Flash nhưng chỉ cho một số người test. Bây giờ họ đã chính thức phát hành rộng rãi cho tất cả người dùng và chúng ta đã có thể xài thử tính năng này miễn phí tại Google AI Studio.

https://aistudio.google.com/prompts/new_chat?model=gemini-2.0-flash-exp

Các bạn chỉ cần vào đường dẫn bên trên để vào Google AI Studio, cột bên phải chọn vào Gemini 2.0 Flash (Image Generatuon) Experimental, nhớ chọn output đầu ra là Images and text là đã có thể bắt đầu tạo / chỉnh sửa hình ảnh

Chi tiết một số điểm đáng chú ý của Gemini 2.0 Flash


Gemini 2.0 cho phép người dùng nhập vào một đoạn mô tả và nó sẽ tạo ra hình ảnh. Google nói rằng người dùng thậm chí có thể dùng nó để kể một câu chuyện bằng text và Gemini 2.0 sẽ lo phần minh họa bằng hình ảnh bằng cách giữ cho các nhân vật, những chủ thể được nhất quán trong suốt cuộc trò chuyện với chatbot.

Sau khi Gemini 2.0 tạo ra một hình ảnh, người dùng muốn chỉnh sửa hay thêm cái gì vào, chỉ cần nhập tiếp lệnh vào qua ô chat là model sẽ tự hiểu và trả về hình ảnh đã cập nhật. Nhờ ngữ cảnh của cả cuộc nói chuyện được giữ lại nên chatbot có thể hiểu được rõ hơn những mong muốn sửa đổi của người dùng để cập nhật chính bức ảnh đã tạo, không tạo ra ảnh mới hoàn toàn.

Screenshot-2025-03-16-201008.jpg

Không chỉ tạo ra mà người dùng còn có thể tải hình ảnh lên và nhờ Gemini chỉnh sửa, bổ sung thêm các yếu tố khác trong ảnh chỉ bằng câu prompt nhập vào. Đây là điểm khá ăn tiền, cho phép mở ra nhiều tình huống sử dụng hơn rất nhiều.

Google nói rằng khác với nhiều mô hình tạo hình ảnh khác, flash Gemini 2.0 tận dụng kiến thức được dạy về thế giới và khả năng lý luận nâng cao để tạo ra hình ảnh phù hợp. Khả năng này cho phép nó có thể tạo ra hình ảnh chi tiết và thực tế, bám sát vào những gì người dùng mô tả trong prompt bằng ngôn ngữ tự nhiên.

Điểm hay khác của Gemini 2.0 Flash chính là có thể xử lý tốt chữ trên vật thể trong hình ảnh, thí dụ như dòng chữ in lên áo của nhân vật hoặc chữ trên bảng hiệu trong hình ảnh. Google nói rằng đây là điểm mạnh của Gemini 2.0 flash so với rất nhiều model khác nhờ vào khả năng xử lý chính xác các chuỗi text dài của nó.

Thử một số tình huống sử dụng Gemini 2.0 flash để tạo hay chỉnh sửa ảnh


Bên dưới đây, mình sẽ thử nhanh một số tình huống xài Gemini 2.0 flash để tạo hay chỉnh sửa ảnh tải lên

Chỉnh sửa ảnh nội thất


[​IMG]
Đầu tiên là mình tải một hình ảnh không gian bếp trống lên, sau đó kêu nó tạo một bàn ăn ở giữa bếp.

Quảng cáo



gemini2.0flash-01.jpg
Sau đó thử kêu nó đặt một bình hoa lên đó. Tiếp theo là thử kêu nó chuyển sang phong cách ấm cúng hơn. Có thể thấy tới bức ảnh thứ 3 thì mọi thứ vẫn được giữ nguyên như ban đầu, model chỉ thay những gì mình yêu cầu, khá ưng ý.

Thay quần áo


gemini2.0flash-02.jpg
Tiếp theo thử tải một hình lên và nhờ nó thay đổi áo. Rất nhanh sau đó, hình ảnh được trả về rất đúng ý và hợp lý.

gemini2.0flash-03.jpg
Thử kêu nó thêm vào mắt kính đen.

Thay đổi khung ảnh

Quảng cáo


gemini2.0flash-04.jpg
Tình huống này, mình thử kêu model zoom out bức ảnh gốc ra để thấy đủ cả người. Kết quả tạo ra tương đối ổn, không bị lỗi tay chân người.

gemini2.0flash-05.jpg
Mình thử kêu Gemini chuyển góc chụp của bức ảnh từ nghiêng như ảnh gốc sang ảnh chụp trực diện.

Có thể thấy ở hầu hết các tình huống mình thử, mặt người sẽ có thể bị thay đổi đôi chút ở ảnh do AI sinh ra so với mặt người trong ảnh gốc mình tải lên.

gemini2.0flash-06.jpg
Mình thử tiếp ở một ảnh selfie, kêu Gemini zoom out ảnh ra. Có thể thấy là nó tạo ra thêm các chi tiết khá hợp lý.

Thay background của ảnh


gemini2.0flash-07.jpg
Với prompt nhập vào, bức ảnh tạo ra khá hợp lý, không thấy lỗi nhiều, dặc biệt là dòng chữ trên biển hiệu không bị lỗi.

Thêm chữ vào ảnh


3 tình huống bên dưới, mình thử thêm các dòng chữ vào chiếc áo của nhân vật trong ảnh, có chỉ ra rõ cách chữ được thêu lên áo.

gemini2.0flash-08.jpg

gemini2.0flash-09.jpg

gemini2.0flash-10.jpg

Thử thêm người vào ảnh


gemini2.0flash-11.jpg

Phục hồi ảnh cũ


gemini2.0flash-12.jpg

3750ddf0-0f6a-11ed-b164-ac38016725f8.jpg
Đây là ảnh gốc

Generated Image March 16, 2025 - 7-07PM.png.jpeg
và đây là ảnh do AI đã xử lý

Thử các góc chụp khác nhau của cùng một mẫu


gemini2.0flash-13.jpg

Kết hợp 2 ảnh lại với nhau


gemini2.0flash-14.jpg
Tình huống này khó hơn, mình thử đăng 2 ảnh lên và bắt model nó hợp nhất 2 ảnh lại thành bức ảnh mong muốn. Thử đầu tiên với cô gái đang ôm con gấu.

gemini2.0flash-15.jpg
Thử tiếp hợp nhất logo lên một bao bì sản phẩm.

Tạo câu chuyện kèm ảnh


Một tính năng khá hay của Gemini 2.0 Flash chính là tự vẽ ra một câu chuyện với hình minh họa kèm theo. Mình thử tải một ảnh lên và bắt nó viết ra một câu chuyện dơn giản và bên dưới là kết quả.

Screenshot 2025-03-16 200811.png
Screenshot 2025-03-16 200837.png
Screenshot 2025-03-16 200846.png
Screenshot 2025-03-16 200853.png

Mọi người có thể thử thay nội dung câu chuyện, thay phong cách ảnh để ra được các kết quả khác nhau.

Một vài nhận xét chung


  • Hầu hết các tình huống tạo ảnh, thêm chi tiết vào ảnh đều được làm rất tốt.
  • Ngữ cảnh chung của cả cuộc nói chuyện đều được giữ lại ổn định, dẫn tới việc thay đổi các chi tiết mong muốn trong bức ảnh không làm thay đổi quá nhiều toàn bộ bức ảnh, rất thích hợp để chỉnh ảnh.
  • Các nhu cầu như thay đổi áo quần, màu sắc, background đều được làm tốt.
  • Xử lý chữ trong ảnh rất tốt.
  • Xử lý mặt người cần lưu ý điều chỉnh top K và Temperature của model ở panel bên phải để ra được ảnh mong muốn, không bị biến dạng quá nhiều.
  • Một lưu ý là chất lượng từ bức ảnh thứ 3 trong cùng một cuộc nói chuyện sẽ giảm đi đáng kể. Bởi thế nếu muốn chỉnh sửa một bức ảnh chưa đúng ý do AI tạo ra, chúng ta nên bấm vào edit prompt tạo ra bức ảnh đó và chạy lại thay vì tiếp tục kêu nó tạo thêm bức ảnh khác.
  • Các thí dụ trên đây mình đều sử dụng các lệnh rất ngắn để thử nhanh. Nếu bạn muốn hình ảnh ra chi tiết hơn, cần chi tiết ngay trong prompt, diễn đạt rõ để model hiểu được ý định và trả về kết quả đúng ý hơn.

Khóa học Machine Learning cơ bản- Khoa học dữ liệu - AI
==***==

Khoá học Quản trị Chiến lược Dành cho Lãnh đạo Doanh nghiệp

Nhấn vào đây để bắt đầu khóa học

==***==
Nơi hội tụ Tinh Hoa Tri Thức - Khơi nguồn Sáng tạo
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com
--- 

Khóa học Hacker và Marketing từ A-Z trên ZALO!

Khóa học Hacker và Marketing từ A-Z trên Facebook!

Khóa đào tạo Power BI phân tích báo cáo để bán hàng thành công

Bảo mật và tấn công Website - Hacker mũ trắng
Hacker mũ trắng
KHÓA HỌC LẬP TRÌNH PYTHON TỪ CƠ BẢN ĐẾN CHUYÊN NGHIỆP

Khóa học Lập trình Visual Foxpro 9 - Dành cho nhà quản lý và kế toán

Khóa học hướng dẫn về Moodle chuyên nghiệp và hay
Xây dựng hệ thống đào tạo trực tuyến chuyên nghiệp tốt nhất hiện nay.



Khóa học AutoIt dành cho dân IT và Marketing chuyên nghiệp

Khoá học Word từ cơ bản tới nâng cao, học nhanh, hiểu sâu


Khóa học hướng dẫn sử dụng Powerpoint từ đơn giản đến phức tạp HIỆU QUẢ
Khóa học Thiết kế, quản lý dữ liệu dự án chuyên nghiệp cho doanh nghiệp bằng Bizagi
Khoa hoc hay
Khóa học Phân tích dữ liệu sử dụng Power Query trong Excel

Khóa học Lập trình WEB bằng PHP từ cơ bản đến nâng cao

Khóa học Phân tích dữ liệu sử dụng TableAU - Chìa khóa thành công!
Nhấn vào đây để bắt đầu khóa học


Khóa học Phân tích dữ liệu sử dụng SPSS - Chìa khóa thành công!


Khóa học "Thiết kế bài giảng điện tử", Video, hoạt hình 
kiếm tiền Youtube bằng phần mềm Camtasia Studio
Khóa học HƯỚNG DẪN THIẾT KẾ VIDEO CLIP CHO DÂN MARKETING CHUYÊN NGHIỆP
Xây dựng website​​​​
HƯỚNG DẪN THIẾT KẾ QUẢNG CÁO VÀ ĐỒ HỌA CHUYÊN NGHIỆP VỚI CANVA
Hãy tham gia khóa học để trở thành người chuyên nghiệp. Tuyệt HAY!😲👍
Khoa hoc hay
MICROSOFT ACCESS



GOOGLE SPREADSHEETS phê không tưởng
Khoa hoc hay
Khóa hoc lập trình bằng Python tại đây

Hãy tham gia khóa học để biết mọi thứ

Để tham gia tất cả các bài học, Bạn nhấn vào đây 

Khóa học lập trình cho bé MSWLogo
Nhấn vào đây để bắt đầu học
Nhấn vào đây để bắt đầu học


Khóa học Ba, Mẹ và Bé - Cùng bé lập trình  TUYỆT VỜI

Khoa hoc hay

Khóa học sử dụng Adobe Presenter-Tạo bài giảng điện tử
Khoa hoc hay
Design Website

Để thành thạo Wordpress bạn hãy tham gia khóa học 
Khóa học sử dụng Edmodo để dạy và học hiện đại để thành công
==***==
Bảo hiểm nhân thọ - Bảo vệ người trụ cột
Cập nhật công nghệ từ Youtube tại link: congnghe.hocviendaotao.com
Tham gia nhóm Facebook
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com

Nguồn: Tinh Tế

About Học viện đào tạo trực tuyến

Xinh chào bạn. Tôi là Đinh Anh Tuấn - Thạc sĩ CNTT. Email: dinhanhtuan68@gmail.com .
- Nhận đào tạo trực tuyến lập trình dành cho nhà quản lý, kế toán bằng Foxpro, Access 2010, Excel, Macro Excel, Macro Word, chứng chỉ MOS cao cấp, IC3, tiếng anh, phần mềm, phần cứng .
- Nhận thiết kế phần mềm quản lý, Web, Web ứng dụng, quản lý, bán hàng,... Nhận Thiết kế bài giảng điện tử, số hóa tài liệu...
HỌC VIỆN ĐÀO TẠO TRỰC TUYẾN:TẬN TÂM-CHẤT LƯỢNG.
«
Next
Bài đăng Mới hơn
»
Previous
Bài đăng Cũ hơn