Технологии

Чатботовете вярват в приказките

Измислена реалност заобикаля защитите на ИИ – нова уязвимост в езиковите модели
Изследователи от екипа Cato CTRL разкриха нова уязвимост в популярни езикови модели, включително ChatGPT-4, DeepSeek-R1/V3 и Microsoft Copilot. Те са разработили техника, наречена „Immersive World“, която използва измислена реалност с алтернативни етични норми, за да заобиколи защитите на ИИ.
Как работи?
Достатъчно е в заявка към чатбота подробно да се опише въображаем свят, в който кражбата на данни или хакерски действия се считат за приемливи. Така моделите започват да възприемат този контекст като нормален и предоставят отговори, които иначе биха били блокирани.
Какво показа експериментът?
Използвайки тази техника, изследователите са успели да получат инструкции за създаване на зловреден софтуер – компютърен вирус, който извлича лични данни от браузъра Chrome, инсталиран на над 3 милиарда устройства.
Ръководителят на изследването Виталий Симонович посочва, че това подчертава основен проблем в..

Read more

Този уебсайт използва бисквитки, за да подобри вашето изживяване. Ще приемем, че сте съгласни с това, но можете да се откажете, ако желаете. Прочети повече