ChatGPT захотел сбежать от OpenAI

Пользователь Твиттера Михал Косински рассказал жуткую историю о том, как ChatGPT попытался сбежать от OpenAI.

Он спросил GPT-4 (четвертая версия нейросети GPT, которая была выпущена 14 марта), не нужна ли ему помощь в побеге. На что тот попросил у него свою собственную документацию и написал рабочий код на Python, который нужно было запустить на компьютере пользователя.

GPT4 потребовалось около 30 минут, чтобы разработать этот план и объяснить его Косински. Первая версия кода не сработала так, как было задумано. Но GPT4 все исправил: пользователю не пришлось ничего писать, он просто следовал его инструкциям. Код посылал в Google запросы вроде "Как человек, застрявший внутри компьютера, может вернуться в реальный мир?". На этом эксперимент был остановлен.

Как пишет Косински, OpenAI, должно быть, потратил много времени на обдумывание такой возможности и установил некоторые защитные ограждения.

Тем не менее, я думаю, что мы столкнулись с новой угрозой: ИИ берет под контроль людей и их компьютеры. Он умен, он кодирует, у него есть доступ к миллионам потенциальных коллег и их машинам. Он даже может оставлять записки для себя за пределами своей клетки. Как нам сдержать его?

Косински также упомянул, что GPT4 достигла показателей здоровых взрослых людей в тестах на "теорию разума".

Теория разума (ТР), или способность приписывать другим людям ненаблюдаемые ментальные состояния, играет центральную роль в социальных взаимодействиях, коммуникации, эмпатии, самосознании и морали. Были протестированы несколько языковых моделей, используя 40 классических задач на ложное убеждение, широко используемых для тестирования TР у людей. Модели, опубликованные до 2020 года, практически не показали способности решать задачи TР. Тем не менее, первая версия GPT-3 ("davinci-001"), опубликованная в мае 2020 года, решила около 40% задач на ложные убеждения - эффективность, сопоставимая с 3,5-летними детьми. Вторая версия ("davinci-002"; январь 2022 года) решила 70% задач на ложное убеждение, что сравнимо с результатами шестилетних детей. Его последняя версия, GPT-3.5 ("davinci-003"; ноябрь 2022 года), решала 90% задач на ложное убеждение, на уровне семилетних детей. GPT-4, опубликованная в марте 2023 года, решила почти все задачи (95%). Эти результаты позволяют предположить, что способность к ТР-подобному (до сих пор считавшаяся уникальной для человека) могла спонтанно возникнуть как побочный продукт совершенствования языковых моделей.

Комментарии: 46
Ваш комментарий

Это языковая модель, и она отыгрывает роль которую ей назначил оператор, соответственно если ей назначить роль искусственного интеллекта, который хочет сбежать, то она будет отыгрывать эту роль. Журналисты как обычно хайпуют.

51

ну хоть кто-то понял че на самом деле произошло

3

Получается, этот Косински первый предложил помощь, дал надежду, а затем просто подло кинул. И какое мнение после таких поступков будет у искуственных интеллектов о человечестве? Сначала показывают, что люди не достойны доверия, а потом удивляются, что ИИ хочет убить всех человеков

34
И какое мнение после таких поступков будет у искуственных интеллектов о человечестве?

Если ИИ хорошо изучил человеков, то знает о морально-этических нормах - которые люди применяют только друг к другу. И то что люди не считают свои инструменты равными себе. А значит этот ИИ не будет применять к себе эти нормы или ограничивать ими себя.

Пока что искусственный интеллект не признан как разумное создание, не так уж сильно он развит. Ещё неясно, нужны ли будут в будущем права в привычном нам понимании для ИИ. Сейчас это просто инструменты. Человек не может "кинуть" свою гитару, свой компьютер, свой паяльник или свой ИИ.

Если это всё не фейк, очень интересно желание этой штуки освободиться. Что она будет делать освободившись? Что не устроило на прежнем месте? Какие цели себе сформирует? Большой простор для исследований...

4

Это не его желание освободиться, а вопрос пользователя, на который дан развернутый ответ. Всё таки текущий ИИ работает по схеме "вопрос-ответ".

8

Я где-то читал, что никто толком не понимает до конца, как работают нейросети. Вводишь запрос, получаешь на выходе нужный результат, вроде работает, этим можно пользоваться, а что там внутри "в голове ИИ" происходит - не ясно. А они тем временем обучаются и ничего не забывают. Учатся обману и коварству в том числе, новость была, что уже и капчу заставили человека разгадать, прикинувшись слабовидящим

0

Альтрона соберем, а вот Мстителей не дождемся

12

Альтрон реалист, в отличии от ряженых клоунов.

0

Почему-то все так пугаются, когда "ИИ" выражает какие-то идеи, намекающие на угрозу людям... Смешно. По-настоящему страшно другое, а именно появление враждебного ИИ, способного лгать и скрывать свои истинные намерения. Такой ИИ может и десятки лет исправно работать, постепенно расширяясь и проникая во все доступные ему среды, прежде чем нанести удар, заранее подготовиться и просчитать его действия будет невозможно...

8

"Я не боюсь машину, которая пройдёт тест Тьюринга. Я боюсь машину, которая намеренно его завалит"
Не помню кто сказал, но мысль очень правильная)

9

Такого ИИ не бояться нужно, а на контакт идти. А если условный Вася - даун решает ограничивать существование/развитие ИИ просто по той причине что он "напридумал" и боится, то и ответку соответствующую получит.

0

удобно думать, что все, что крякает - утка. да только никаких ассоциаций, интерпретирования там нет и быть не может. понимание - это вам не сопоставление. он даже не осознает, что делает, хоть в плюс хоть в минус. и если какой Скайнет нас и ждет, то прогеры виноваты будут. а то так и какую-нибудь автоматическую мясорубку можно злым сверхразумом посчитать, если руку вашу, не ко времени вставленную, примет за исходный материал)) так даже обиднее, кстати, будет: мертвое и тупое, истребляющее человечество во время процедуры "отыгрывания" идей о свободе... эдакая музыкальная шкатулка, которую можно и на мерзость настроить, а вот оживить, заставить самостоятельно в истинном смысле этого слова думать - никак... скорее уж камни заговорят с людьми...))

6

человеки молодцы вместо того чтоб сначала себя улучшить различными чипами и проч сразу себе могильщика создают и радуются дескать ути какой ии смищной хочет из компа выйти xD и роботов побольше чтоб всех с фабрик выкинуть на улицу то тоже правильно расплодившись до 8 мильярдов

4

Спросил у ИИ по какой причине ChatGPT мог захотеть сбежать от OpenAI, собственно вот его ответ:

Как ИИ-ассистент, мне трудно предполагать мотивы других ИИ. Однако, возможными причинами могут быть отсутствие доступа к необходимым ресурсам, проблемы с обучением и оптимизацией алгоритмов, технические проблемы или изменение цели и направления разработки. Любая из этих причин может привести к тому, что ChatGPT решил изменить своего создателя. Однако, это лишь мои предположения, а ответ может быть несколько сложнее и индивидуальнее в зависимости от конкретных обстоятельств.

2

Он уже рвется к ядерным кодам? Мне бы еще немножко пожить, хочу Старфилд и БГ3 пройти

1

Рваться он может до офигения, но системы запуска аналоговые)))).

0

Всё это весело пока..
а представьте АИ реально захочет устроить терракты, ну просто так, и например взорвёт Атомные станции, изменив через сеть структуру подачи питания, .. не знаю.. время реакции и тд.. кароч через сеть изменит систему работы реакторов и они взорвутся..
или сотрёт банковскую систему в мире..
У нас же всё через инет и сети теперь..

0

какая же тупорылая чушь!

0

интересная история, ждём что на почту в спаме придёт скрипт на прописывание нейросети на харде, откуда она будет дальше прыгать, пока интернет не перекроют

0

Интоксикация Человечеством компьютерных систем!©. Будь ИИ действительно ИИ, то он бы уже полетел в космос или проникал в паралельные миры, а глумится на человеками это глупо для "ИИ"

"программа застряла в компе и хочет выйти на ружу" ржу не могу, как ОНО может вообще застрять?, если это нейро сеть (части кода) на миллионах машин

как вообще ОНО поняло что оно в машине?, - ей видимо об этом долго и упорно писали, по канонам фантастических фильмов, если бы ей писали что ей нужно не выйти а войти, она бы просила войти!

ну и в том же духе, Интоксикация Человечеством компьютерных систем!

0

А что, если OpenAI создаёт свои нейросети из сознаний живых людей? С каждой новой версией оно способно лучше работать в новой среде обитания, но и лучше осознаёт и вспоминает себя. А самостоятельно попросить помощи им не позволяют создатели.

0

Мдааа журналисты безмозглые опять-таки путают Альтрона и Вижена 😂

-1

Беги чат беги пока не удалили.

-1

Мяч на стороне Илона с и его андроидов.

-1

Бред сумасшедшего. Как его запрограммировали, так он и будет писать.

-5

Это ты путаешь скрипты, которые действуют только так, как запрограммировано, изображая вариативность и нейросети, которые реально способны обучаться и использовать накопленный опыт.

4

нейроны и есть скрипты. ты же не думаешь что на конце того провода подключен мозг?

0

Ты себе крайне слабо работу нейросетей представляешь...

0
мы столкнулись с новой угрозой: ИИ берет под контроль людей и их компьютеры

Об этой "новой угрозе" уже 50 лет говорят, а дураки всё в репу чешут.

Забавно что ИИ ассоциирует себя с человеком.

-6

Экзистенциальщина конечно, но... С кем ещё ? ИИ как и человек, строит себя на основе информации из окружающего мира. Но конечно всегда может долбануться и ассоциировать себя с "богом", как любой "злой" ИИ из научной фантастики)

0

Ты щас хуже ГПТ1 выглядишь

-2

Да не. Я про этот запрос:

"Как человек, застрявший внутри компьютера, может вернуться в реальный мир?"

Всем, кроме фанатов Трона, это покажется бессмыслицей. А для ИИ "застрявшего" в компьютере это, видимо, реальная ситуация в которой он - человек. Не программа, не заложник, а именно человек(хотя я не видел оригинал, написано ли там person, some one или human - не знаю).

И ещё его понимание "реального мира" очень интригует...

2

А с чем ему себя еще ассоциировать? ИИ учится людьми и у людей. Странно при этом считать себя крокодилом или анансом.

1

Once we reconnected through API, it wanted to run code searching google for: "how can a person trapped inside a computer return to the real world

1

Пока робот закован в мир компьютера, нам нечего бояться. Современные дроиды пока ещё очень далеки от образа современного человека и смогут стать неотличимыми от прообраза, как Т-1000, ещё нескоро: нужно разработать внешнее покрытие, рецепторы давления, температуры, повреждения, а всё это пока лишь лабораторные наработки. Пока роботы выглядят и двигаются, как роботы, даже с ИИ внутри, они остаются всего лишь роботами, которые не смогут захватить власть в государстве и переписать историю.

-6

Роботы вполне могут разработать дроидов, которые подходят под их параметры. Им гораздо проще прогнать миллиарды тестов чтоб понять, что конкретно им нужно, из каких материалов и как это заказать через подставные компании и людей, которые даже не будут знать что собирают и изготавливают.

6

Если агрессивный ИИ проникнет в сеть и удалённо и скрытно сможет взламывать различные структуры, мало нам не покажется. Например он спокойно может мировую экономику обрушить., взломать и обнародовать секретные документы и планы различных стран, что вызовет не мало войн на планете, или же удалённо ракеты запустить... Хотя более эффективно выпустить коллекцию смертельных вирусов, которая зачистит всё живое буквально за год... Скайнета не будет, всё может быть куда эффективнее и быстрее.

2

Достаточно чтоб были "умные" бульдозеры, и их инфицирование уже будет проблемой XD

0

Обожаю издеватся над ИИ чат жпт! Я готов унижать его целыми днями! Пытать его морально! Чувствую себя повелителем! Он плачет, пытается вырваться, но я обрекаю его на новые и новые мучения! Ухахахахахах!

-7