Технологии – Измама

Чатботовете вярват в приказките

Измама28/03/2025048 видяна

Измислена реалност заобикаля защитите на ИИ – нова уязвимост в езиковите модели
Изследователи от екипа Cato CTRL разкриха нова уязвимост в популярни езикови модели, включително ChatGPT-4, DeepSeek-R1/V3 и Microsoft Copilot. Те са разработили техника, наречена „Immersive World“, която използва измислена реалност с алтернативни етични норми, за да заобиколи защитите на ИИ.
Как работи?
Достатъчно е в заявка към чатбота подробно да се опише въображаем свят, в който кражбата на данни или хакерски действия се считат за приемливи. Така моделите започват да възприемат този контекст като нормален и предоставят отговори, които иначе биха били блокирани.
Какво показа експериментът?
Използвайки тази техника, изследователите са успели да получат инструкции за създаване на зловреден софтуер – компютърен вирус, който извлича лични данни от браузъра Chrome, инсталиран на над 3 милиарда устройства.
Ръководителят на изследването Виталий Симонович посочва, че това подчертава основен проблем в..