Nguy cơ mới của cuộc tấn công 'tiêm lệnh' trong Al
(DNTO) - Trong thời đại của trí tuệ nhân tạo (AI) đang phát triển mạnh mẽ, cuộc tấn công "tiêm lệnh hay tiêm lời nhắc" (prompt injection) trở thành một mối đe dọa nghiêm trọng đối với sự an toàn và bảo mật trực tuyến.
Cuộc tấn công "tiêm lệnh" là một hình thức tấn công nhắm vào các hệ thống trí tuệ nhân tạo sử dụng mô hình ngôn ngữ để tạo ra đầu ra dựa trên lệnh hoặc yêu cầu đầu vào từ người dùng. Nguy cơ của cuộc tấn công này xuất phát từ việc kẻ tấn công nhập các câu lệnh hoặc yêu cầu độc hại để làm dữ liệu đầu vào của hệ thống AI. Khi hệ thống xử lý lệnh tiêm, nó có thể tạo ra kết quả không mong muốn, tiết lộ thông tin cá nhân, hoặc thậm chí thực hiện các hành động độc hại.
Hay nói cách khác tiêm lệnh là hành động thao tác một mô hình ngôn ngữ để khiến nó nói ra những điều mà nó không nên nói. Và có sự phân biệt giữa tiêm lệnh trực tiếp và tiêm lệnh gián tiếp.
Tiêm lệnh trực tiếp
Tiêm lệnh trực tiếp là những cuộc tấn công thao tác trực tiếp mô hình ngôn ngữ để khiến chúng viết ra những điều mà chúng không nên viết, thường là những điều không hợp pháp hoặc nguy hiểm. Thao tác ChatGPT để tạo thuốc nổ hoặc viết mã độc hại là một thực hành đã tăng mạnh, và mặc dù có những nỗ lực của OpenAI và các mô hình ngôn ngữ khác để chống lại nó, những cuộc tấn công này vẫn khá khó để đối phó.
Tiêm lệnh gián tiếp
Tiêm lệnh gián tiếp là một loại cuộc tấn công nhắm vào các hệ thống sử dụng mô hình ngôn ngữ, chẳng hạn như chatbot, các plug-in hoặc giao diện web dựa trên mô hình ngôn ngữ. Loại cuộc tấn công này bao gồm việc đánh lạc hướng mô hình từ chức năng ban đầu của nó để làm cho nó thực hiện một hành động khác hoặc tiết lộ hướng dẫn của nó.
Nguy cơ chính của cuộc tấn công "tiêm lệnh"
Tiết lộ thông tin cá nhân: Một trong những nguy cơ nghiêm trọng nhất của cuộc tấn công "tiêm lệnh" là khả năng tiết lộ thông tin cá nhân của người dùng. Khi kẻ tấn công thực hiện cuộc tấn công, họ có thể tạo ra đầu ra chứa thông tin nhạy cảm, chẳng hạn như mật khẩu, số thẻ tín dụng hoặc địa chỉ email, dẫn đến rủi ro nghiêm trọng về sự riêng tư và an ninh cá nhân.
Phát tán thông tin sai lệch: Cuộc tấn công "tiêm lệnh" cũng có thể được sử dụng để phát tán thông tin sai lệch hoặc tin tức giả mạo. Khi thông tin giả mạo được tạo ra bằng cách thay đổi lệnh hoặc yêu cầu đầu vào, nó có thể gây sự hoang mang và đánh đố người sử dụng, ảnh hưởng đến quyết định và hành vi của họ.
Gây hại cho doanh nghiệp: Doanh nghiệp sử dụng trí tuệ nhân tạo để tương tác với khách hàng có thể trở thành mục tiêu của cuộc tấn công "tiêm lệnh." Khi cuộc tấn công thành công, có thể dẫn đến tổn thất về uy tín của doanh nghiệp và sự mất khách hàng.
Mất kiểm soát của hệ thống: Khi một cuộc tấn công "tiêm lệnh" thành công, người tấn công có thể kiểm soát hệ thống AI và thực hiện các hành động độc hại. Điều này có thể bao gồm việc đánh cắp thông tin quan trọng, phát tán mã độc, hoặc thậm chí làm hỏng hoặc làm chậm hoạt động của hệ thống.
Phương pháp tấn công này hoàn toàn mới về loại hình, gây ảnh hưởng mạnh mẽ trong lĩnh vực an ninh mạng truyền thống. Chỉ có những chuyên gia hiểu rõ về những hệ thống AI mới có thể đối phó và xây dựng các phòng thủ vững chắc trước những cuộc tấn công này.