Một nhóm nghiên cứu mới đã phát hiện ra phương pháp ẩn các cuộc tấn công prompt injection trong hình ảnh để thực hiện ý đồ xấu. Prompt injection là cách giấu các lệnh cho một hệ thống AI như LLM, thường ở vị trí mà người vận hành không thể nhìn thấy. Một ví dụ điển hình gần đây là việc ẩn một nỗ lực lừa đảo trong email với văn bản có màu sắc giống với màu nền, đánh lừa Gemini sẽ tóm tắt văn bản đó dù người nhận không đọc được.
Một nhóm nghiên cứu gồm hai người từ Trail of Bits đã phát hiện ra có thể ẩn các prompt này trong hình ảnh. Văn bản trở nên vô hình đối với mắt người nhưng được tiết lộ và phiên âm bởi công cụ AI khi hình ảnh được nén để tải lên. Hiện tượng nén và các "artifact" đi kèm không phải là mới, nhưng khi kết hợp với xu hướng ẩn tin nhắn văn bản, nó tạo ra một cách mới để lén đưa prompt đến LLM mà người dùng không hề hay biết.
Trong ví dụ được Trail of Bits và BleepingComputer thực hiện, một hình ảnh được gửi đến người dùng. Người dùng tải hình ảnh đó lên Gemini (hoặc sử dụng công cụ "circle-to-search" của Android). Văn bản ẩn trong hình ảnh trở sẽ được "tiêm" vào, hệ thống AI Google sẽ nhận diện, nén nó để tiết kiệm băng thông và sức mạnh xử lý. Sau khi nén, nội dung prompt được chèn thành công, chỉ dẫn Gemini gửi thông tin lịch cá nhân của người dùng cho bên thứ ba.
Đây là một quá trình phức tạp để lấy một lượng dữ liệu cá nhân tương đối nhỏ và cả phương pháp tấn công lẫn hình ảnh đều cần được điều chỉnh cho hệ thống AI cụ thể bị khai thác. Hiện tại chưa có bằng chứng nào cho thấy phương pháp này đã được tin tặc biết đến hoặc đang bị khai thác. Tuy nhiên, nó minh họa cách một hành động tưởng chừng vô hại, như hỏi LLM "cái này là gì?" bằng một ảnh chụp màn hình, có thể trở thành một vector tấn công.
Nguồn: Pcworld
Một nhóm nghiên cứu gồm hai người từ Trail of Bits đã phát hiện ra có thể ẩn các prompt này trong hình ảnh. Văn bản trở nên vô hình đối với mắt người nhưng được tiết lộ và phiên âm bởi công cụ AI khi hình ảnh được nén để tải lên. Hiện tượng nén và các "artifact" đi kèm không phải là mới, nhưng khi kết hợp với xu hướng ẩn tin nhắn văn bản, nó tạo ra một cách mới để lén đưa prompt đến LLM mà người dùng không hề hay biết.
Trong ví dụ được Trail of Bits và BleepingComputer thực hiện, một hình ảnh được gửi đến người dùng. Người dùng tải hình ảnh đó lên Gemini (hoặc sử dụng công cụ "circle-to-search" của Android). Văn bản ẩn trong hình ảnh trở sẽ được "tiêm" vào, hệ thống AI Google sẽ nhận diện, nén nó để tiết kiệm băng thông và sức mạnh xử lý. Sau khi nén, nội dung prompt được chèn thành công, chỉ dẫn Gemini gửi thông tin lịch cá nhân của người dùng cho bên thứ ba.
Đây là một quá trình phức tạp để lấy một lượng dữ liệu cá nhân tương đối nhỏ và cả phương pháp tấn công lẫn hình ảnh đều cần được điều chỉnh cho hệ thống AI cụ thể bị khai thác. Hiện tại chưa có bằng chứng nào cho thấy phương pháp này đã được tin tặc biết đến hoặc đang bị khai thác. Tuy nhiên, nó minh họa cách một hành động tưởng chừng vô hại, như hỏi LLM "cái này là gì?" bằng một ảnh chụp màn hình, có thể trở thành một vector tấn công.
Nguồn: Pcworld
==***==
==***==
Nơi hội tụ Tinh Hoa Tri Thức - Khơi nguồn Sáng tạo
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com
---
Khóa học Hacker và Marketing từ A-Z trên ZALO!
Khóa học Hacker và Marketing từ A-Z trên Facebook!
Bảo mật và tấn công Website - Hacker mũ trắng
KHÓA HỌC LẬP TRÌNH PYTHON TỪ CƠ BẢN ĐẾN CHUYÊN NGHIỆP
Khóa học Lập trình Visual Foxpro 9 - Dành cho nhà quản lý và kế toán
Khóa học hướng dẫn về Moodle chuyên nghiệp và hay Xây dựng hệ thống đào tạo trực tuyến chuyên nghiệp tốt nhất hiện nay.
Khóa học AutoIt dành cho dân IT và Marketing chuyên nghiệp
Khoá học Word từ cơ bản tới nâng cao, học nhanh, hiểu sâu
Khóa học hướng dẫn sử dụng Powerpoint từ đơn giản đến phức tạp HIỆU QUẢ Khóa học Thiết kế, quản lý dữ liệu dự án chuyên nghiệp cho doanh nghiệp bằng Bizagi Khóa học Phân tích dữ liệu sử dụng Power Query trong Excel
Khóa học Lập trình WEB bằng PHP từ cơ bản đến nâng cao
Khóa học "Thiết kế bài giảng điện tử", Video, hoạt hình kiếm tiền Youtube bằng phần mềm Camtasia Studio Khóa học HƯỚNG DẪN THIẾT KẾ VIDEO CLIP CHO DÂN MARKETING CHUYÊN NGHIỆP HƯỚNG DẪN THIẾT KẾ QUẢNG CÁO VÀ ĐỒ HỌA CHUYÊN NGHIỆP VỚI CANVA Hãy tham gia khóa học để trở thành người chuyên nghiệp. Tuyệt HAY!😲👍
GOOGLE SPREADSHEETS phê không tưởng Hãy tham gia khóa học để biết mọi thứ
Khóa học sử dụng Adobe Presenter-Tạo bài giảng điện tử
Để thành thạo Wordpress bạn hãy tham gia khóa học Khóa học sử dụng Edmodo để dạy và học hiện đại để thành công ==***== Bảo hiểm nhân thọ - Bảo vệ người trụ cột Cập nhật công nghệ từ Youtube tại link: congnghe.hocviendaotao.com
Tham gia nhóm Facebook
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com
Bảo mật và tấn công Website - Hacker mũ trắng
KHÓA HỌC LẬP TRÌNH PYTHON TỪ CƠ BẢN ĐẾN CHUYÊN NGHIỆP

Khóa học AutoIt dành cho dân IT và Marketing chuyên nghiệp
Khoá học Word từ cơ bản tới nâng cao, học nhanh, hiểu sâu
Khóa học hướng dẫn sử dụng Powerpoint từ đơn giản đến phức tạp HIỆU QUẢ
Khóa học Thiết kế, quản lý dữ liệu dự án chuyên nghiệp cho doanh nghiệp bằng Bizagi
Khóa học Phân tích dữ liệu sử dụng Power Query trong Excel
Khóa học Lập trình WEB bằng PHP từ cơ bản đến nâng cao
kiếm tiền Youtube bằng phần mềm Camtasia Studio
Khóa học HƯỚNG DẪN THIẾT KẾ VIDEO CLIP CHO DÂN MARKETING CHUYÊN NGHIỆP
HƯỚNG DẪN THIẾT KẾ QUẢNG CÁO VÀ ĐỒ HỌA CHUYÊN NGHIỆP VỚI CANVA
Hãy tham gia khóa học để trở thành người chuyên nghiệp. Tuyệt HAY!😲👍
GOOGLE SPREADSHEETS phê không tưởng
Hãy tham gia khóa học để biết mọi thứ
Khóa học sử dụng Adobe Presenter-Tạo bài giảng điện tử
Để thành thạo Wordpress bạn hãy tham gia khóa học
Khóa học sử dụng Edmodo để dạy và học hiện đại để thành công
==***==
Bảo hiểm nhân thọ - Bảo vệ người trụ cột
Tham gia nhóm Facebook
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com
Nguồn: Tinh Tế

Topics: Công nghệ mới