08.01.2026 17:04
Самообучающийся ИИ, который ставит задачи и проверяет себя без человека.
Современные системы искусственного интеллекта достигли впечатляющих результатов, однако их фундаментальный принцип обучения по-прежнему остается вторичным: модели учатся, подражая человеку или решая заранее подготовленные задачи. Новый исследовательский подход предлагает радикально иной вектор развития — ИИ, который обучается сам, формулируя собственные вопросы и проверяя свои ответы без участия человека.
Международная команда ученых из Университета Цинхуа, Пекинского института общего искусственного интеллекта (BIGAI) и Университета штата Пенсильвания представила систему Absolute Zero Reasoner (AZR) — экспериментальную архитектуру, в которой модель одновременно выступает и учеником, и учителем. Она самостоятельно генерирует задачи, решает их, проверяет результат через выполнение кода и использует успехи и ошибки как сигнал для дальнейшего улучшения.
Ключевая особенность AZR заключается в замкнутом цикле обучения: языковая модель создает программные задачи на Python, затем сама же пытается их решить и объективно проверить корректность решения. В отличие от классического обучения с подкреплением, где качество ответа оценивает человек или заранее заданная метрика, здесь источником «истины» становится сама вычислимая среда — запуск кода и его результат.
Эксперименты показали, что такой подход существенно повышает уровень логического мышления и навыков программирования даже у относительно компактных моделей. Версии открытой модели Qwen с 7 и 14 миллиардами параметров не только продемонстрировали заметный рост качества рассуждений, но и в ряде задач превзошли модели, обученные на вручную размеченных данных. Это указывает на потенциал самообучения как альтернативы дорогостоящему человеческому труду.
Исследователи подчеркивают, что подобная схема ближе к тому, как обучается человек: сначала — имитация, затем — постановка собственных вопросов, эксперименты и выход за рамки полученных знаний. Такой механизм масштабируется естественным образом: по мере роста возможностей модели увеличивается и сложность задач, которые она способна себе ставить.
Пока технология ограничена областями, где результат можно строго проверить — программированием, математикой, формальными задачами. Однако в перспективе этот подход может быть распространен на агентные системы: автономных ИИ, выполняющих действия в браузере, офисных приложениях или цифровых средах, оценивая корректность собственных решений.
Важно и то, что Absolute Zero — не единичный эксперимент. Похожие идеи начинают появляться в крупных ИИ-лабораториях: от самообучающихся программных агентов до систем, развивающих общие навыки рассуждения через эксперимент и самопроверку. Это указывает на формирование новой парадигмы обучения, где ИИ перестает быть пассивным потребителем данных и становится активным исследователем.
На фоне дефицита качественных обучающих данных и роста стоимости их подготовки такие методы могут стать критически важными для дальнейшего развития индустрии. Если модели научатся эффективно учиться без человека, это приблизит технологии к созданию по-настоящему автономного интеллекта — систем, способных не только повторять человеческие решения, но и выходить за их пределы.