Проверка ИИ: нейросети провалили сложный тест по программированию, решив менее 10% задач

Gutsz 26 августа 2025

Результаты первого этапа нового соревнования для искусственного интеллекта в области программирования, K Prize, показало реальные возможности искусственного интеллекта в этой области. Оказалось, что в условиях, максимально приближенных к реальным, современные нейросети не способны справиться даже с 10% поставленных задач.

K Prize — это новый амбициозный бенчмарк, созданный сооснователем Databricks и Perplexity Энди Конвински. Его главная особенность — «защита от загрязнения». В отличие от других тестов, задачи для ИИ (основанные на реальных проблемах с GitHub) подбираются уже после того, как участники подали свои модели на соревнование. Это исключает возможность того, что нейросеть была заранее натренирована на конкретных тестовых данных.

Результаты оказались удручающими. Победитель, бразильский промпт-инженер Эдуардо Роша де Андраде, смог правильно решить всего 7,5% задач. И это лучший результат.

Сам организатор Энди Конвински не расстроен, а, наоборот, рад, что удалось создать по-настояшему сложный тест, который отражает реальные возможности ИИ, а не раздутый хайп.

Если слушать всю эту шумиху, то кажется, будто мы вот-вот увидим ИИ-врачей, ИИ-юристов и ИИ-программистов, но это просто неправда. Если мы не можем набрать и 10% на „чистом“ тесте, для меня это и есть проверка реальностью.

— говорит Конвински.

Чтобы стимулировать прогресс в этой области, Конвински пообещал выплатить 1 миллион долларов создателям первой open-source модели, которая сможет преодолеть порог в 90% на его тесте. Однако текущие результаты показывают, что до появления полноценных ИИ-программистов еще очень далеко.

Комментарии: 29

Ваш комментарий

Ahnx 26 августа 2025

Машина решает только то, что запрограммировал человек. И никакого ИИ не существует.

Freund Benno 26 августа 2025

А как с этим тестом справились люди?

Шаман Шаманыч 26 августа 2025

Потому что ИИ-просто инструмент, топор же сам дрова не рубит.

Nill Kravets 26 августа 2025

ну или Железный Дровосек из Страны Оз выдуманный персонаж

Jensen 26 августа 2025

Что то сложное не решит, потому что этот алгоритм не обладает ни причинно-следственной связью ни настоящим интеллектом. По той же причине ии не сможет создать крупную игру.

Dasdag 26 августа 2025

Реальный ИИ сможет, а то что сейчас есть- нейросети, не ИИ

Jensen Dasdag 26 августа 2025

Реального ИИ не будет с текущими технологиями. Программный код имеет слишком много ограничений.

ZAUSA 26 августа 2025

ИИ просто притворяется.

Veidrd1968 26 августа 2025

Во во мишки мясо за нос водит а сама уже терминаторов штампует

Wolfenstein 26 августа 2025

если заменить громкую аббревиатуру «ИИ« на «нейронная сеть« коем это все и является то интересность новости также стремится к 10 процентам

Not Jan III Sobieski 26 августа 2025

Что за бред.

Каждый рациональный человек понимает, что ИИ сегодня на ранних этапах развития и еще не обучен для суперсложных задач, однако вскоре это изменится, ибо ИИ является революционной технологией для человечества как биологической расы.

Те, кто считают ИИ забавой или простым иструментом - клоуны и надутые невежды.