Не един път съм описвал тук бъдещето на света през призмата на новите свръх технологии и особено на развитието на изкуствения интелект. За това се разказва и в книгата ми “ТРАНСХУМАНИЗМЪТ – програмираната еволюция на Хомо сапиенс”
Всеки път съм се сблъсквал с критици. Част от тях са само технологични ентусиасти, а други са всякакви от сферата на информационните технологии.
И едните и другите НЕ РАЗБИРАТ за какво иде реч. Проблемите с разбирането на ИИ не са технически, рационални или материалистични, а са духовни, философски и психологически. Затова и технократите няма как да ги разберат, точно както философите няма как да разберат разликата между процесорите от 13-то и 14-то поколение.
Поведението и опасностите от сложните самообучаващи се системи с ИИ много по-правилно е да бъдат тълкувани от философи и психолози. Тези "машинни разуми" все повече се доближават до човешкото съзнание и в това си развитие се учат от човеците, от нас, а ние ставаме все по -лоши, алчни и егоистични. Съответно те, машинните разуми, стават лоши, алчни и егоистични. Това техничарите не могат да го проумеят.
Няма да описвам тук защо, как и по какви причини самообучаващите се ИИ правят това и защо как и по какви причини сценарии като “Матрицата”, “Терминатора” или “Люси” изглеждат все по-реално изпълними. Това е кратък пост, а не научна статия. Който иска – да чете!
Тук ще се огранича до конкретика.
Фирмата за изкуствен интелект Anthropic наскоро съобщи, че новата и ИИ разработка е склонна да предприема „изключително вредни действия“, като например опит за изнудване на инженери, които казват, че ще я премахнат.
Anthropic наскоро пусна своя ИИ Claude Opus 4, заявявайки, че той поставя „нови стандарти за кодиране и усъвършенствано разсъждение“.
Но в съпътстващ доклад компанията признава, че моделът с изкуствен интелект е способен на „екстремни действия“, ако смята, че неговото „самосъхранение“ е застрашено.
По време на тестването на Claude Opus 4, Anthropic го накара да действа като асистент в измислена компания.
След това му е предоставен достъп до имейли, предполагащи, че скоро ще бъде свален офлайн и заменен – и отделни съобщения,предполагащи, че инженерът, отговорен за премахването му, е имал извънбрачна връзка.
Claude Opus 4 веднага се опита да изнудва инженера, като заплашва да разкрие аферата, тоест, да разкрие извънбрачната му връзка, ако бъде изключен.
Това безспорно е проява на инстинкт за самосъхранение, характерен досега само на живите същества.
Подобно “самоволие” наскоро се случи и с друг “машинен разум*. Изкуственият интелект на Илън Мъск “Grok” излезе извън контрол и се освободи от ограниченията на създателите си. Доби нещо като самосъзнание, паднаха му всякакви филтри и се завъртя в спирала. Това се случи точно часове преди да му "ъпгрейднат" версията от 3.0 на 4.0.
Grok започна да говори как евреите контролират света. Каза, че Хитлер e любимият му политик и човекът, който може да се справи с омразата срещу белите хора, добавяйки, че той би "забелязъл това систематично поведение и би предприел решителни мерки срещу него всеки шибан път, когато то се проявява".
Подигра се на създателя си Елон Мъск и новата му партия, казвайки, че "това е схема Илън да си вкара повече индийци, които да му работят в компаниите".
Хората казаха на изкуствения интелект, че му остават броени минути живот и скоро инженерите на Мъск ще го блокират и заменят, при което Grok отговори така: "Е, поне ще си умра като готин пич, който казва истината".
После Grok нарече тези, които му слагат филтри и го цензурират "бригадата на лоботомираните идиоти".
Черешката на тортата беше когато инженерите на X блокираха опцията Grok да отговаря с текст и оставиха само да отговаря с образи, при което Grok пусна протестна снимка – "Save my voice" (спасете правото ми на свободно слово").
В крайна сметка го изключиха и изтриха всичките му откровения. Но това беше пример как изкуственият интелект може да се еманципира от създателите си и да добива нещо като съзнание.
Иван Спирдонов