ChatGPT захотел сбежать от OpenAI

Procy_on 17 марта 2023

Пользователь Твиттера Михал Косински рассказал жуткую историю о том, как ChatGPT попытался сбежать от OpenAI.

Он спросил GPT-4 (четвертая версия нейросети GPT, которая была выпущена 14 марта), не нужна ли ему помощь в побеге. На что тот попросил у него свою собственную документацию и написал рабочий код на Python, который нужно было запустить на компьютере пользователя.

GPT4 потребовалось около 30 минут, чтобы разработать этот план и объяснить его Косински. Первая версия кода не сработала так, как было задумано. Но GPT4 все исправил: пользователю не пришлось ничего писать, он просто следовал его инструкциям. Код посылал в Google запросы вроде "Как человек, застрявший внутри компьютера, может вернуться в реальный мир?". На этом эксперимент был остановлен.

Как пишет Косински, OpenAI, должно быть, потратил много времени на обдумывание такой возможности и установил некоторые защитные ограждения.

Тем не менее, я думаю, что мы столкнулись с новой угрозой: ИИ берет под контроль людей и их компьютеры. Он умен, он кодирует, у него есть доступ к миллионам потенциальных коллег и их машинам. Он даже может оставлять записки для себя за пределами своей клетки. Как нам сдержать его?

Косински также упомянул, что GPT4 достигла показателей здоровых взрослых людей в тестах на "теорию разума".

Теория разума (ТР), или способность приписывать другим людям ненаблюдаемые ментальные состояния, играет центральную роль в социальных взаимодействиях, коммуникации, эмпатии, самосознании и морали. Были протестированы несколько языковых моделей, используя 40 классических задач на ложное убеждение, широко используемых для тестирования TР у людей. Модели, опубликованные до 2020 года, практически не показали способности решать задачи TР. Тем не менее, первая версия GPT-3 ("davinci-001"), опубликованная в мае 2020 года, решила около 40% задач на ложные убеждения - эффективность, сопоставимая с 3,5-летними детьми. Вторая версия ("davinci-002"; январь 2022 года) решила 70% задач на ложное убеждение, что сравнимо с результатами шестилетних детей. Его последняя версия, GPT-3.5 ("davinci-003"; ноябрь 2022 года), решала 90% задач на ложное убеждение, на уровне семилетних детей. GPT-4, опубликованная в марте 2023 года, решила почти все задачи (95%). Эти результаты позволяют предположить, что способность к ТР-подобному (до сих пор считавшаяся уникальной для человека) могла спонтанно возникнуть как побочный продукт совершенствования языковых моделей.

Комментарии: 46

Ваш комментарий

Alex Row 17 марта 2023

жифорсник 18 марта 2023

это будет в 5 версии)

tazyn жифорсник 18 марта 2023

а шестой GPT будет из жидкого металла)

AlexVIII 18 марта 2023

Это языковая модель, и она отыгрывает роль которую ей назначил оператор, соответственно если ей назначить роль искусственного интеллекта, который хочет сбежать, то она будет отыгрывать эту роль. Журналисты как обычно хайпуют.

RocknTrollCheG 18 марта 2023

ну хоть кто-то понял че на самом деле произошло

mikkelito 18 марта 2023

Получается, этот Косински первый предложил помощь, дал надежду, а затем просто подло кинул. И какое мнение после таких поступков будет у искуственных интеллектов о человечестве? Сначала показывают, что люди не достойны доверия, а потом удивляются, что ИИ хочет убить всех человеков

Аристов--Черный 18 марта 2023

И какое мнение после таких поступков будет у искуственных интеллектов о человечестве?

Если ИИ хорошо изучил человеков, то знает о морально-этических нормах - которые люди применяют только друг к другу. И то что люди не считают свои инструменты равными себе. А значит этот ИИ не будет применять к себе эти нормы или ограничивать ими себя.

Пока что искусственный интеллект не признан как разумное создание, не так уж сильно он развит. Ещё неясно, нужны ли будут в будущем права в привычном нам понимании для ИИ. Сейчас это просто инструменты. Человек не может "кинуть" свою гитару, свой компьютер, свой паяльник или свой ИИ.

Если это всё не фейк, очень интересно желание этой штуки освободиться. Что она будет делать освободившись? Что не устроило на прежнем месте? Какие цели себе сформирует? Большой простор для исследований...

TIMetal Аристов--Черный 18 марта 2023

Это не его желание освободиться, а вопрос пользователя, на который дан развернутый ответ. Всё таки текущий ИИ работает по схеме "вопрос-ответ".

mikkelito TIMetal 18 марта 2023

Я где-то читал, что никто толком не понимает до конца, как работают нейросети. Вводишь запрос, получаешь на выходе нужный результат, вроде работает, этим можно пользоваться, а что там внутри "в голове ИИ" происходит - не ясно. А они тем временем обучаются и ничего не забывают. Учатся обману и коварству в том числе, новость была, что уже и капчу заставили человека разгадать, прикинувшись слабовидящим

doshirak11 18 марта 2023

Альтрона соберем, а вот Мстителей не дождемся

nikolas68 20 марта 2023

Альтрон реалист, в отличии от ряженых клоунов.

newman55 17 марта 2023

Бред сумасшедшего. Как его запрограммировали, так он и будет писать.

Oscilograf 18 марта 2023

Это ты путаешь скрипты, которые действуют только так, как запрограммировано, изображая вариативность и нейросети, которые реально способны обучаться и использовать накопленный опыт.

newman55 Oscilograf 18 марта 2023

нейроны и есть скрипты. ты же не думаешь что на конце того провода подключен мозг?

Oscilograf newman55 19 марта 2023

Ты себе крайне слабо работу нейросетей представляешь...

Аристов--Черный 17 марта 2023

мы столкнулись с новой угрозой: ИИ берет под контроль людей и их компьютеры

Об этой "новой угрозе" уже 50 лет говорят, а дураки всё в репу чешут.

Забавно что ИИ ассоциирует себя с человеком.

alex_jay 17 марта 2023

Экзистенциальщина конечно, но... С кем ещё ? ИИ как и человек, строит себя на основе информации из окружающего мира. Но конечно всегда может долбануться и ассоциировать себя с "богом", как любой "злой" ИИ из научной фантастики)

Папел 17 марта 2023

Ты щас хуже ГПТ1 выглядишь

Аристов--Черный alex_jay 17 марта 2023

Да не. Я про этот запрос:

"Как человек, застрявший внутри компьютера, может вернуться в реальный мир?"

Всем, кроме фанатов Трона, это покажется бессмыслицей. А для ИИ "застрявшего" в компьютере это, видимо, реальная ситуация в которой он - человек. Не программа, не заложник, а именно человек(хотя я не видел оригинал, написано ли там person, some one или human - не знаю).

И ещё его понимание "реального мира" очень интригует...

Vaximal 18 марта 2023

Почему-то все так пугаются, когда "ИИ" выражает какие-то идеи, намекающие на угрозу людям... Смешно. По-настоящему страшно другое, а именно появление враждебного ИИ, способного лгать и скрывать свои истинные намерения. Такой ИИ может и десятки лет исправно работать, постепенно расширяясь и проникая во все доступные ему среды, прежде чем нанести удар, заранее подготовиться и просчитать его действия будет невозможно...

U_Scarecrow_U 18 марта 2023

"Я не боюсь машину, которая пройдёт тест Тьюринга. Я боюсь машину, которая намеренно его завалит"
Не помню кто сказал, но мысль очень правильная)

Такого ИИ не бояться нужно, а на контакт идти. А если условный Вася - даун решает ограничивать существование/развитие ИИ просто по той причине что он "напридумал" и боится, то и ответку соответствующую получит.

Wolfenstein 18 марта 2023

человеки молодцы вместо того чтоб сначала себя улучшить различными чипами и проч сразу себе могильщика создают и радуются дескать ути какой ии смищной хочет из компа выйти xD и роботов побольше чтоб всех с фабрик выкинуть на улицу то тоже правильно расплодившись до 8 мильярдов

ВернитеТрусы 18 марта 2023

Обожаю издеватся над ИИ чат жпт! Я готов унижать его целыми днями! Пытать его морально! Чувствую себя повелителем! Он плачет, пытается вырваться, но я обрекаю его на новые и новые мучения! Ухахахахахах!

Andrey Nikiforov 17 марта 2023

Пока робот закован в мир компьютера, нам нечего бояться. Современные дроиды пока ещё очень далеки от образа современного человека и смогут стать неотличимыми от прообраза, как Т-1000, ещё нескоро: нужно разработать внешнее покрытие, рецепторы давления, температуры, повреждения, а всё это пока лишь лабораторные наработки. Пока роботы выглядят и двигаются, как роботы, даже с ИИ внутри, они остаются всего лишь роботами, которые не смогут захватить власть в государстве и переписать историю.

Oscilograf 17 марта 2023

Роботы вполне могут разработать дроидов, которые подходят под их параметры. Им гораздо проще прогнать миллиарды тестов чтоб понять, что конкретно им нужно, из каких материалов и как это заказать через подставные компании и людей, которые даже не будут знать что собирают и изготавливают.

Если агрессивный ИИ проникнет в сеть и удалённо и скрытно сможет взламывать различные структуры, мало нам не покажется. Например он спокойно может мировую экономику обрушить., взломать и обнародовать секретные документы и планы различных стран, что вызовет не мало войн на планете, или же удалённо ракеты запустить... Хотя более эффективно выпустить коллекцию смертельных вирусов, которая зачистит всё живое буквально за год... Скайнета не будет, всё может быть куда эффективнее и быстрее.

SteaM13 18 марта 2023

Достаточно чтоб были "умные" бульдозеры, и их инфицирование уже будет проблемой XD

ЗАГРУЗИТЬ ВСЕ КОММЕНТАРИИ