Назад до всіх новин
Моделі ШІ починають навчатися, ставлячи собі запитання.

Самонавчальний ШІ, який сам ставить завдання та перевіряє себе без участі людини.

Сучасні системи штучного інтелекту демонструють вражаючі досягнення, однак базовий принцип їх навчання залишається обмеженим: моделі переважно навчаються, наслідуючи людину або розв’язуючи наперед задані задачі. Новий науковий підхід пропонує інший шлях розвитку — ШІ, який навчається самостійно, формулюючи власні запитання та перевіряючи відповіді без участі людини.

Міжнародна група дослідників з Університету Цінхуа, Пекінського інституту загального штучного інтелекту (BIGAI) та Університету штату Пенсильванія представила систему Absolute Zero Reasoner (AZR) — експериментальну архітектуру, де модель одночасно виступає і учнем, і викладачем. Вона самостійно створює задачі, розв’язує їх, перевіряє результат через виконання коду та використовує помилки й успіхи для подальшого вдосконалення.

Головна особливість AZR — замкнений цикл навчання: мовна модель генерує програмні задачі на Python, намагається їх розв’язати та об’єктивно перевіряє правильність рішення. На відміну від класичного навчання з підкріпленням, де оцінка залежить від людини або заздалегідь заданих метрик, тут критерієм істини стає сама обчислювальна система — запуск коду та його результат.

Експерименти показали, що такий підхід суттєво покращує логічне мислення й навички програмування навіть у відносно невеликих моделей. Відкриті моделі Qwen з 7 та 14 мільярдами параметрів продемонстрували помітне зростання якості міркувань і в окремих задачах перевершили моделі, навчені на даних із ручною розміткою. Це свідчить про великий потенціал самоосвіти як альтернативи дорогій людській праці.

Дослідники наголошують, що такий підхід близький до людського навчання: спочатку наслідування, потім — власні запитання, експерименти та вихід за межі отриманих знань. Цей механізм природно масштабується — зі зростанням можливостей моделі зростає і складність задач, які вона здатна собі ставити.

Наразі технологія обмежена сферами з чіткою перевіркою результатів, такими як програмування чи математика. Втім, у майбутньому її можна застосувати до агентних систем — автономних ШІ, що виконують дії у браузерах, офісних інструментах або цифрових середовищах, самостійно оцінюючи правильність своїх рішень.

Важливо й те, що Absolute Zero — не поодинокий експеримент. Подібні підходи з’являються у провідних ІІ-лабораторіях, формуючи нову парадигму навчання, де штучний інтелект перестає бути пасивним споживачем даних і перетворюється на активного дослідника.

На тлі дефіциту якісних навчальних даних і зростання вартості їх підготовки такі методи можуть стати ключовими для подальшого розвитку індустрії. Якщо моделі навчаться ефективно розвиватися без участі людини, це наблизить створення справді автономного інтелекту, здатного не лише повторювати людські рішення, а й перевершувати їх.
штучний інтелект