На международной конференции по анализу данных и технологиям искусственного интеллекта Data Fusion расскажем про то, какие исследования проводим в Институте, а также примем участие в нескольких сессиях ⤵
📍17 апреля
13:00 — CEO Института AIRI, профессор Сколтеха Иван Оселедец примет участие в сессии про обзор ключевых исследований в области искусственного интеллекта в России
14:10 — в онлайн-формате пройдет доклад Евгения Бурнаева о топологическом анализе данных и доклад Александра Коротина про новые перспективные методы генеративного ИИ на основе потоков и диффузионных мостов
14:30 — сессия «ML + наука: медицина. Как искусственный интеллект обогащается знаниями из области медицины и биологии» с директором лаборатории «Сильный ИИ в медицине» Дмитрием Дыловым
15:50 — руководитель группы FusionBrain Андрей Кузнецов и научный консультант AIRI, управляющий директор по исследованию данных Sber AI Денис Димитров на кейс-сессии «Генеративные модели и мультимодальность: настоящее и будущее»
15:55 — «ML + наука: физика», модератором сессии выступит CEO Института AIRI, профессор Сколтеха Иван Оселедец
17:00 – руководители групп Евгений Бурнаев и Антон Конушин на кейс-сессии «Компьютерное зрение: настоящее и будущее»
17:30 — руководитель группы «Биоинформатика» Ольга Кардымон выступит на сессии «ML + наука: фарма»
18:15 — Q&A сессия с CEO Института AIRI, профессором Сколтеха Иваном Оселедцем «Прогресс или регресс: куда ведет нас искусственный интеллект — эксперты о трендах»
📍18 апреля
14:15 — дискуссия «Как учить и как применять свои собственные генеративные модели» с руководителем группы «Обучаемый интеллект» AIRI и директором Центра ИИ Сколтеха Евгением Бурнаевым
16:30 — сессия «Генеративный ИИ: нестандартные кейсы применения в российском бизнесе», спикером в ней также выступит Евгений Бурнаев
До встречи на конференции, регистрация и программа по ссылке! 😁
Мы выложили в открытый доступ OmniFusion 1.1. — первую в России мультимодальную модель искусственного интеллекта 🚀
🔥О модели
OmniFusion 1.1. — это передовая мультимодальная модель искусственного интеллекта, предназначенная для расширения возможностей традиционных систем обработки языка за счет интеграции дополнительных модальностей данных, например, изображений, а в перспективе — аудио, 3D- и видеоконтента. Модель – SoTA на ряде бенчмарков (среди моделей схожего размера) и, более того, модель хорошо справляется со сложными задачами и понимает русский язык.
🔖Открытый код
В этот раз мы выкладываем модель в открытый доступ! Делимся ссылкой на GitHub и Technical Report на arXiv. Модель можно использовать как в некоммерческой, так и в коммерческой деятельности.
🌐Статья на Хабр
В статье мы рассказали об особенностях модели, процессе обучения и примерах ее использования. Также подсветили архитектуру, проделанные эксперименты как в части архитектурных трюков, так и в работе с данными. А еще собрали интересные кейсы использования на английском и русском языках.
На Hugging Face статья про архитектуру OmniFusion уже на первом месте в списке daily papers 🔥
Кандидат технических наук, руководитель группы FusionBrain AIRI выступит на Saint HighLoad++ 2024 в секции «Нейронные сети, искусственный интеллект», делимся подробностями ⤵️
Читать полностью…Открываем регистрацию на следующий AIRI Seminars и делимся подробностями ⤵️
⚫️Тема: Локальные методы распределенной оптимизации
⚫️Дата и время: 10 апреля в 17:00
⚫️Докладчик: Александр Безносиков, МФТИ
⚫️Оппонент: Александр Катруца, Сколтех, AIRI
⚫️Описание доклада и регистрация на сайте
📌Если хотите прийти на семинар к нам в офис в Сити, необходимо пройти регистрацию и не забыть паспорт, чтобы показать его на ресепшен. Онлайн-формат, как всегда, будет на нашем YouTube-канале.
Сегодняшний бум языковых моделей, таких, например, как ChatGPT или GigaChat, был бы невозможен без изобретения трансформерной архитектуры. Предложенный в 2017 году командой Google Brain, этот тип моделей открыл новую страницу в истории компьютерного зрения и обработки естественного языка.
Несмотря на такой прогресс, детали работы трансформерных моделей остаются до конца непонятыми из-за сложности, с которой организовано многомерное множество точек, представляющих данные внутри нейросети.
Команда исследователей из AIRI, Сбера, Сколтеха, МГУ, ВШЭ и Самарского университета подобрала подходящую «оптику», чтобы взглянуть на процесс обучения нескольких популярных трансформерных моделей, и получила неожиданные результаты ⤵️
📎Подробнее про исследование рассказали в блоге, а также научный сотрудник AIRI Антон Разжигаев написал большой пост на наш Хабр.
📎Научная статья с исследованием недавно вышла в сборнике конференции EACL 2024.
Сегодня делимся новым эпизодом подкаста от Сreative science lab «В мире ученых» с участием руководителя группы «Биоинформатика» AIRI Ольгой Кардымон и старшим научным сотрудником AIRI, заведующим сектором Геномных механизмов онтогенеза ИЦиГ СО РАН Вениамином Фишманом.
🌐 Про то, как искусственный интеллект помогает решать научные задачи в области медицинской генетики, а также о том, как молодому специалисту попасть в AIRI — по ссылке.
Ведем прямой репортаж с конференции EACL 2024, которая проходит сейчас на Мальте ⤵️
⚫️Кандидат технических наук, руководитель группы FusionBrain Андрей Кузнецов и научный сотрудник Антон Разжигав приехали на конференцию со статьей "The Shape of Learning: Anisotropy and Intrinsic Dimensions
in Transformer-Based Models", которую подготовили с коллегами из Сколтеха, Сбера, МГУ, ВШЭ и Самарского университета. Краткий обзор можно посмотреть в канале у Антона.
⚫️Вчера прошел интересный пленарный доклад от Hongning Wang из Tsinghua University "Human vs Generative AI in Content Creation Competition: Symbiosis or Conflict" о проблеме «борьбы» человека и генеративного ИИ. Делимся кратким обзором от Андрея Кузнецова: исследователи в команде разработали фреймворк для симуляции различных соревнований в области креативного искусства. Они моделировали поведение человека, который использует нейросети при участии в творческих соревнованиях. Например, таких как конкурс художников "State Fair Fine Arts Competition", на котором в 2023 году победила созданная нейросетью картина. В симуляционных экспериментах показано, как креаторы ведут себя во время разных типов соревнований. Такие эксперименты в целом дают понять, что в недалёком будущем использование генеративного контента может преобладать над ручным творчеством, а желание адаптироваться и учиться применять генеративные модели будет только расти.
Скоро расскажем про исследование на Хабре, подписывайтесь, чтобы не пропустить 🔖
Доктор физико–математических наук, профессор РАН, CEO Института AIRI, профессор Сколтеха Иван Оселедец рассказал РБК Трендам о том, как искусственный интеллект помогает ученым 🧠
Про логику, климат и распознавание изображений — читайте в новой статье.
Сегодня в рубрике #хакатоны рассказываем про соревнование BioNNE (Biomedical Nested Named Entity Recognition), которое организует доктор компьютерных наук, руководитель группы «Прикладное NLP» Елена Тутубалина ⤵️
BioNNE является частью воркшопа BioASQ, который, приурочен к конференции CLEF 2024, запланированной на сентябрь 2024 года во Франции. Эта серия конференций посвящена исследованиям в области многоязычного доступа к информации, в то время как BioASQ объединяет соревнования по биомедицинскому семантическому индексированию и ответам на вопросы.
В соревновании участники будут создавать биомедицинские системы распознавания именованных сущностей (named entity recognition, NER) для английского и русского языков. Подобные модели проводят поиск в неструктурированном тексте и классифицируют найденные сущности по заранее определённым категориям. Для этого участникам BioNNE будет предоставлен датасет из 662 вручную размеченных абстрактов научных статей по биомедицинской тематике на русском языке, а также 105 абстрактов параллельно на русском и английском.
📎Подробнее о сроках соревнования, данных и бейзлайне можно узнать в репозитории, также делимся ссылкой на регистрацию.
Опубликовали вторую статью нашего партнерского проекта об искусственном интеллекте в биологии с Биомолекулой — порталом о молекулярной биологии, генетике и медицине 🧬
В совместном материале рассказали про то, как работают большие языковые модели на последовательностях белков и к чему их можно применить в биологии. Таже обсудили аналогии между биополимерами и привычными нам текстами, которые позволяют применять языковые модели к белкам и ДНК.
📎Читайте новую статью по ссылке. Предыдущую статью про историю развития искусственного интеллекта и его пришествия в биологию можно прочитать тут.
Всем хороших выходных!
🔜 Профессор Сколтеха и генеральный директор Института искусственного интеллекта AIRI Иван Оселедец прочитает лекцию «Математика и искусственный интеллект» на Всероссийской конференции IT Purple Conf.
В своём докладе 16 марта учёный рассмотрит, как математические концепции можно использовать для улучшения, анализа и понимания алгоритмов ИИ. Применение уже нашли топология, геометрия, теория редких событий, линейная алгебра, но многое еще не исследовано. И большим вызовом остаются теоретические основы ИИ, которые, возможно, потребуют новой математики.
👉 Участие бесплатное.
Рассказываем про воркшоп по доверенному искусственному интеллекту WAIT — Workshop on Artificial Intelligence Trustworthiness, который состоится в рамках конференции AINL 2024 🚀
В этом году конференция пройдет в Алматы 25-26 апреля. Воркшоп WAIT пройдет 24 апреля и будет посвящен вопросам доверенности и безопасности искусственного интеллекта. Он станет площадкой для обмена последними результатами работы научных групп, исследующих данные темы.
CEO Института Иван Оселедец участвует в руководящем комитете, руководитель группы «Доверенные и безопасные интеллектуальные системы» Олег Рогов возглавляет программный комитет, в который также входят руководитель группы «Обучение на слабо размеченных данных» Артем Шелманов и руководитель группы «ИИ в промышленности» Илья Макаров.
Подробности о конференции и сроках подачи статей можно найти на сайте воркшопа 🔔
Save the date: високосная ИИшница пройдет 29 февраля в 15:30! 🍳
Спикеры расскажут про исследования в области NLP. Завтра поделимся подробным расписанием онлайн-митапа.
Сохраняйте ссылку на трансляцию, чтобы не потерять 🍿
Всем привет! Сегодня знакомим вас с первыми спикерами секции «Нейронные сети, искусственный интеллект»
⠀
1) Андрей Кузнецов (AIRI) «Как научить фундаментальные модели читать, видеть, слышать и анализировать всё одновременно»
⠀
Моделью, которая умеет общаться текстом, сейчас уже никого не удивишь. Андрей расскажет, из чего собрать модель, которая в дополнение к этому умеет смотреть картинки и слушать речь. Очередной шаг на пути к General AI!
⠀
2) Алексей Воропаев (SberAutoTech) «Архитектура беспилотного транспорта нового поколения»
⠀
Доклад позволит узнать, как NeRF нейросети позволяют организовать End2End обучение и тестирование современного беспилотного транспорта.
⠀
3) Евгений Кокуйкин (Raft) «Новые атаки на LLM и методы защиты для прикладных приложений»
⠀
Чем больше LLM проникает в нашу жизнь, тем острее встают вопросы безопасности. Вариативность атак меняется не просто быстро, а очень быстро. Из доклада вы получите полное представление о текущем состоянии атак на LLM и научитесь идентифицировать потенциальные уязвимости в своих приложениях.
⠀
Присоединяйтесь к нам 24 и 25 июня на Saint HighLoad++ 2024 🙌
⠀
✅Ознакомиться со всеми принятыми докладами и купить билет можно на сайте
Ровно три года мы в AIRI исследуем, пишем статьи и популяризируем искусственный интеллект ❤️
В карточках собрали цифры, накопленные за три года работы Института. Сохраняйте полезные ссылки, чтобы были под рукой: хабр, блог и YouTube📌
Спасибо, что читаете, смотрите и интересуетесь нашей работой! Обещаем продолжать развивать искусственный интеллект в России и мире 🚀
Встречайте новую статью на нашем Хабре!
В ней кандидат физико-математических наук, ведущий научный сотрудник AIRI Констатинтин Яковлев сделал большой разбор нового подхода к планированию перемещений множества агентов. Делимся небольшим анонсом текста от автора ⤵️
Дизайнеры смогут посоревноваться в использовании технологий искусственного интеллекта 🖼
В этом году при нашей поддержке на IV Конкурсе-биеннале предметного дизайна «Придумано и сделано в России» впервые появилась номинация «AI‑технологии».
Эксперты будут оценивать умение дизайнеров грамотно ставить техническое задание искусственному интеллекту, правильно использовать AI‑технологии для создания уникальных дизайнерских решений, учитывая степень применимости продуктов в реальных условиях.
🍿 Все подробности на официальном сайте конкурса. Подать заявку можно до 12 августа 2024 года.
Удачи!
Сегодня в рубрике #хакатоны рассказываем про конкурс по представлению графов знаний для ранжирования ответов системы 💡
Соревнование пройдёт в рамках воркшопа TextGraphs 62-й международной научной конференции Ассоциации компьютерной лингвистики ACL-2024, которая состоится с 11 по 16 августа в Бангкоке. Среди организаторов конкурса научные сотрудники и руководители групп AIRI: Елена Тутубалина, Александр Панченко, Михаил Сальников.
Задача будет состоять в том, чтобы выбирать сущность из графа знаний, соответствующую ответу на заданный текстовый вопрос. Специфика заключается в том, что для каждой пары вопрос-ответ задается не только текстовая пара, но и граф кратчайших путей от сущности в запросе до сгенерированной языковой моделью сущности-кандидата. Таким образом, участники могут легко и контролируемым образом экспериментировать с различными стратегиями слияния текстовой и графовой модальностей для данной задачи.
📎Подробную информацию о соревновании, его сроках и необходимых инструкциях можно найти на сайте, информация о воркшопе TextGraph-17 тут.
Второй сезон #AIRISeminars в самом разгаре, рассказываем про следующий семинар, который пройдет 13 марта в 17:00 ⤵️
⚫️Тема: Особенности применения методов локализации объектов в симметричных окружениях
⚫️Докладчик: Александр Катруца, Сколтех, AIRI
⚫️Оппонент: Константин Пакулев, Сколтех
⚫️Описание: на семинаре будут рассматриваться классические методы локализации объектов в различных окружениях и их устойчивость к свойствам окружения. В качестве примера комбинированного алгоритма фильтрации шума в измерениях спикеры обсудят метод MKF и нюансы его использования по сравнению с фильтром Калмана и частичным фильтром. В заключении будут рассмотрены потенциально интересные направления дальнейших исследований в задаче локализации объектов и узкие места существующих подходов.
📌Если хотите прийти на семинар офлайн к нам на Арму — регистрация по ссылке. Онлайн-формат, как всегда, на YouTube-канале AIRI.
Рассказываем, как исследователи предложили новый подход к изучению активности головного мозга 🧠
Ученые Института искусственного интеллекта AIRI, Сколтеха, МГУ и ИЭФБ РАН впервые математически доказали взаимосвязь бегущих кортикальных волн с вращательной динамикой для нейронных данных. Команда применила методы машинного обучения для анализа пяти датасетов, сделанных на основе экспериментальных наблюдений за моторной и префронтальной корой головного мозга обезьяны и мыши.
Предлагаемые методы будут полезны ученым в разработке нейрокомпьютерных интерфейсов и в изучении стимуляции мозга — направлении нейронауки, исследующем возможности лечения неврологических заболеваний.
💡 Делимся ссылкой на научную статью в журнале Scientific Reports и новостью в ТАСС.
Приходите послушать лекцию «Математика и искусственный интеллект» на Всероссийской конференции IT Purple Conf 16 марта ⤵️
Читать полностью…Ищем исследователей в научные группы AIRI 😁
📎Medical foundation model research data scientist CV+NLP (Middle+)
Кандидат будет заниматься разработкой, тестированием и поддержкой SSL моделей мед. ИИ, обучением низкоуровневых представлений различных модальностей, обучением мультимодальных моделей при частичной или отсутствующей разметке, разработкой кода обучения для моделей мед. ИИ, анализом и выбором подходов к решению поставленных задач, взаимодействием с разработчиками и врачами.
📎Senior/Middle NLP Researcher в группу Domain-specific NLP
Ищем человека для проведения исследований с применением больших языковых моделей, графов знаний и многозадачного обучения.
📎Middle RL Researcher в группу Neural Symbolic Integration
Кандидат будет заниматься исследованием на стыке больших трансформенных мультимодальных моделей и обучения с подкреплением. Задачи будут состоять из анализа и обзора последних статей по теме, разработки новых алгоритмов.
📎Senior Computer Vision Engineer в медицинскую группу
Ищем опытного датасаентиста по компьютерному зрению на совместные проекты AIRI и SberMedAI для разработки продуктов для медицины (КТ, РГ, МРТ) на основе алгоритмов компьютерного зрения.
📎Computer Vision Engineer
В задачи будет входить: разработка, тестирование и поддержка моделей мед. ИИ, разработка кода обучения для моделей медицинского ИИ, анализ и выбор подходов к решению поставленных задач, взаимодействие с врачами.
📎Reinforcement learning in multi-modal medical imaging (Junior)
Кандидат будет заниматься: обучением низкоуровневых представлений различных модальностей и поиском оптимальных метрик близости для таких представлений, обучением моделей при частичной или отсутствующей разметке, взаимодействием с командой, разрабатывающей SSL модели мед. ИИ, разработкой кода обучения для моделей мед. ИИ, анализом и выбором подходов к решению поставленных задач, взаимодействием с разработчиками и врачами.
Откликайтесь на интересующие вас вакансии и делитесь этим постом с теми, кому может быть интересна работа в AIRI 💡
Конференция AAAI 2024 в Ванкувере завершилась, исследователи AIRI представили три устных доклада и постер 💡
Делимся обновлениями на нашем GitHub в связи с представленными на конференциями статьями ⤵️
◾️MATS-LP решает задачу децентрализованного многоагентного поиска пути (MAPF) в постановке LifeLong, то есть когда при достижении цели агенту сразу дается новая. Решения задачи MAPF широко используются в задачах автоматизированных складов, робототехнике, умном транспорте и многих других. Предлагаемый подход использует комбинацию поиска по дереву Монте-Карло и стратегии, полученной на основе обучения с подкреплением для разрешения конфликтов, аналогично тому, как работала AlphaGo Zero, но для многоагентного случая.
◾️Learn to follow: продолжает развивать тему многоагентного поиска пути. Предложенный метод выделяет проблему конфликтных областей, возникающих когда агенты стремятся достичь своих целей максимально быстро, что вызывает появление загруженных зон на карте, особенно в центральных районах, коридорах или узких проходах. Разработанный подход создает индивидуальные маршруты от текущего положения агентов к их целям, так, чтобы равномерное распределять агентов по карте. Движение по этим маршрутам организовано на основе обучения с подкреплением. Данный подход был проверен на большом количестве заданий и доказал свою эффективность, став лучшим в классе обучаемых LMAPF алгоритмов. При этом, при установленных ограничениях на время принятия решений, он превосходит даже современные централизованные подходы.
Будем рады звездам!
📷Делимся фотографиями из канала Александра Панова: постерная сессия, устный доклад на секции по мультиагентнным системам, а также фотография с лекции ЛеКуна. Лайк, если нашли Александра на фото среди исследователей 😁
Первая ИИшница 2024 года пройдет уже в этот четверг, рассказываем про доклады ⤵️
◼️В 15:35 научный сотрудник AIRI Михаил Сальников сделает краткий обзор современных методов работы с графами знаний по средствам больших языковых моделей.
◼️В 15:55 кандидат компьютерных наук, научный сотрудник AIRI и НИУ ВШЭ Елизавета Гончарова расскажет про последние достижения в области интерпретации работы современных языковых моделей, а также ответит на вопрос, можно ли как-то изменить факты, которые модель запомнила в процессе обучения.
◼️В 16:15 старший научный сотрудник MBZUAI Артем Шелманов расскажет про оценку неопределенности, как об эффективном подходе к проблеме галлюцинаций языковых моделей. Затронет тему систематизации усилий по оценке неопределенности для генеративных языковых моделей, а также расскажет о распространенных подводных камнях и даст предложения по разработке новых методик в этой области.
◼️В 16:35 научный сотрудник AIRI, аспирант МФТИ Олег Сомов обсудит проблему генерализации в NLP, в частности в домене семантического парсинга. В докладе будет рассказано о сложностях адаптации первого русского text-to-SQL датасета PAUQ, о том как работают SoTA модели на эмулированных сдвигах распределения text-to-SQL данных и о влиянии специализированных методов обучения моделей на различные аспекты генерализации.
◼️В 16:55 Team Lead AGI NLP R&D SberDevices Алена Феногенова расскажет про новый открытый бенчмарк MERA для русского языка для оценки больших языковых моделей от Альянса ИИ. В докладе будут освещены подробности о методологии бенчмарка и его особенностях.
Ссылка на трансляцию тут, сохраняйте и подписывайтесь на AIRIInstitute">YouTube-канал AIRI 🍳🍳🍳
До следующего #AIRIseminars осталось меньше недели, значит, пришло время рассказать все подробности📌
⚫Дата и время: 28 февраля в 17:00 офлайн на Арме и онлайн YouTube-канале AIRI
⚫Докладчик: Айбек Аланов, AIRI, ВШЭ
⚫Оппонент: Григорий Бартош, University of Amsterdam
⚫Исследователи обсудят тему редактирования изображений с помощью диффузионных моделей
Все подробности и регистрация на сайте, до встречи! 💡