Telegram-канал gonzo_ml - gonzo-обзоры ML статей: Unsorted

gonzo-обзоры ML статей

12 April 2026 16:49

ИИ-исследователи всё более полного цикла.

ASI-Evolve: AI Accelerates AI
Weixian Xu, Tiantian Mi, Yixiu Liu, Yang Nan, Zhimeng Zhou, Lyumanshan Ye, Lin Zhang, Yu Qiao, Pengfei Liu
Paper: https://arxiv.org/abs/2603.29640
Code: https://github.com/GAIR-NLP/ASI-Evolve
Review: https://arxiviq.substack.com/p/asi-evolve-ai-accelerates-ai

# TL;DR

ЧТО сделали: Авторы представили ASI-EVOLVE — агентный фреймворк, созданный для автоматизации дорогих и длительных исследовательских циклов, которые двигают вперёд фундаментальный прогресс в ИИ. Система реализует непрерывную петлю «обучение–дизайн–эксперимент–анализ», усиленную когнитивной базой из априорных человеческих знаний и отдельным модулем-анализатором. Этот анализатор умеет дистиллировать многомерные логи обучения в понятные причинно-следственные инсайты.

ПОЧЕМУ это важно: Хотя предыдущие эволюционные агенты преуспевали в узких алгоритмических задачах или автоматической генерации статей, этот фреймворк демонстрирует унифицированный и полностью автономный поиск сразу в трёх главных столпах современного ИИ: архитектурах моделей, курировании датасетов предобучения и алгоритмах обучения с подкреплением (RL). Успешно перекладывая бремя оптимизации с плеч исследователей на агентный пайплайн, работа создаёт прецедент для рекурсивного самосовершенствования ИИ с замкнутым циклом.

Для практиков: Для опытных специалистов и руководителей, управляющих масштабными исследованиями, ASI-EVOLVE представляет собой структурный сдвиг в подходе к разработке ИИ. Вместо ручной настройки механизмов внимания или формул функции потерь (лосса) в RL, можно развернуть этот фреймворк для автоматического прочёсывания огромных пространств гипотез. Используя семантический поиск по прошлой литературе и программный анализ логов, система уже нашла 105 новых архитектур линейного внимания, превосходящих устоявшиеся бейзлайны, вывела стратегии курирования данных, которые подняли MMLU более чем на 18 пунктов, и сформулировала новые правила обновления для RL. Это прямо указывает на ближайшее будущее, где роль человека сведётся не к инженерному решению задач, а к заданию правильных ограничений для автономного поиска.

Исследовать тут: /channel/gonzo_ML_podcasts/3157