Исследователи OpenAI: системы ИИ могут справиться с большей частью исследовательской работы в течение двух лет

Сообщение Gate News, 29 апреля — исследователи OpenAI Сэбастьен Бьюбек и Эрнест Рю заявляют, что системы ИИ смогут выполнять большую часть человеческой исследовательской работы в течение двух лет, представляя математику как четкий показатель прогресса ИИ. В отличие от расплывчатых тестов производительности, математические задачи дают точную верификацию: ответы либо правильные, либо неправильные, не оставляя места для двусмысленности.

Бьюбек отметил, что истинное мышление ИИ требует способности выдерживать длинные цепочки рассуждений. Одна ошибка в многошаговом аргументе рушит все доказательство, делая обнаружение и исправление ошибок по ходу процесса главной целью для продвинутых моделей. Внутренние лаборатории OpenAI уже сгенерировали более десяти полностью новых теорем, пригодных для публикации в ведущих журналах по комбинаторике, демонстрируя, что ИИ теперь создает действительно оригинальные, прорывные работы, выходя за рамки простого комбинирования уже существующих статей.

Однако устойчивые научные прорывы требуют постоянного сосредоточения на протяжении недель тестирования. Текущие системы все еще нуждаются в строгом человеческом надзоре, чтобы направлять и проверять каждую смену курса. Бьюбек использует выражение “время для достижения AGI” (AGI time), чтобы измерить, как долго модель может независимо имитировать человеческое мышление; текущие системы работают примерно от нескольких дней до одной недели, а цель индустрии — недели или месяцы, чтобы обеспечить автономную работу в таких областях, как биология.

Долговременная память критически важна для этого будущего. Обычные окна чата ограничивают глубину — сложные математические доказательства часто превышают 50 страниц — тогда как репозитории кода показывают, как расширенные сессии работы позволяют вести более глубокое решение задач. По мере того как ИИ получает больше независимости и памяти, человеческая экспертиза становится более ценной, а не менее. Работникам нужно сохранять глубокие базовые знания, чтобы оспаривать и верифицировать ответы машины, а организациям потребуются новые автоматизированные фильтры и системы репутации, чтобы поддерживать доверие в условиях потока научных исследований, дополненных ИИ.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

AstraZeneca расширяет партнерство по ИИ с Immunai до 2027 года

AstraZeneca расширила свою партнёрскую программу с базирующейся в Нью-Йорке AI-биотехнологической компанией Immunai до 2027 года, сообщает Calcalist. В рамках расширенного соглашения Immunai может получить до 37,5 миллиона долларов в 2026 и 2027 годах, поскольку фармпроизводитель продолжает интегрировать свою платформу в онкологические препараты

CryptoFrontier7м назад

DeepL сокращает 250 рабочих мест (25% штата) по мере обострения гонки ИИ с конкурентами

По данным Bloomberg, DeepL сократила 250 рабочих мест, что составляет 25% штата, 7 мая. CEO Ярек Кутыловски заявил, что это решение связано с «масштабным структурным сдвигом», вызванным ИИ. Основанная в 2017 году в Кёльне стартап-компания в сфере переводческого ПО, запущенная как конкурент Google Translate, теперь сталкивается с нарастающим

GateNews7м назад

OpenAI запускает модель GPT-5.5-Cyber для проверенных команд кибербезопасности в четверг

В четверг (8 мая) OpenAI объявила, что ее новейшая модель ИИ-варианта GPT-5.5-Cyber теперь доступна в ограниченном превью для проверенных команд по кибербезопасности. Специализированная версия оптимизирована для задач, связанных с безопасностью, включая выявление и приоритизацию уязвимостей, проверку патчей, а также

GateNews10м назад

Nvidia планирует инвестировать до 2,1 миллиарда долларов в компанию IREN, работающую в сфере дата-центров

Согласно Bloomberg Terminal, Nvidia объявила в четверг, что инвестирует до 2,1 миллиарда долларов в разработчика центров обработки данных IREN Ltd. в рамках партнерства, чтобы ускорить строительство инфраструктуры для искусственного интеллекта. IREN предоставила Nvidia пятилетний ордер на покупку до 30 миллионов sh

GateNews3ч назад

CZ заявил, что YZi Labs выделяет 70% на блокчейн и 20% на ИИ на Consensus Miami 2026

Согласно ChainCatcher, на Consensus Miami 2026 Чжао Чанпэн (CZ) заявил, что YZi Labs направляет 70% финансирования на блокчейн, 20% — на ИИ и 10% — на биотехнологии. CZ добавил, что BNB следует позиционировать как нативную валюту для AI-агентов, а все блокчейны должны быть «AI ready», чтобы поддерживать

GateNews9ч назад

Public приобретает приложение Treasury AI-инвестплатформы, чтобы расширить криптоторговлю

По данным ChainCatcher, Public объявила о приобретении платформы для AI-инвестиций Treasury App, чтобы усилить свой брокерский бизнес, ориентированный на ИИ. Сумма сделки не раскрывалась. В настоящее время Public поддерживает торги акциями, облигациями и криптовалютами, включая Bitcoin, Ethereum, а

GateNews10ч назад
комментарий
0/400
Нет комментариев