Мы разрабатываем решения и продукты на базе технологий NLP, CV и Gen AI. Формируем AI-сообщество, сотрудничаем с ведущими технологическими компаниями и экспертами, проводим исследования, инвестируем в перспективные проекты и команды.
▪ Дипфейки вышли на новый уровень. Кто под ударом в 2025 году? Спойлер: почти все.
Голосовые подделки, фальшивые документы и биометрические атаки — технологии становятся умнее, а вместе с ними и мошенники. Мы в MTS AI и VisionLabs запустили канал, где разбираем самые острые темы: от взломов банков по голосу до цифровых двойников в кино.
Что уже можно почитать:
— как защититься от мошенников, не выходя из Telegram
— как работает биометрия — основные термины
— подменили ли Пола Маккартни — похоже, что нет.
⚡️ Неделя апдейтов китайских моделей
Alibaba представила новую версию своей мультимодальной модели Qwen2.5-VL. Она доступна в трех вариантах: 3B, 7B и 72B параметров и может выступать в роли ИИ-агента, аналогично Operator.
▪ Модель способна:
▪ Бенчмарки
Теперь выполнять рутинные задачи стало проще
OpenAI представили Operator — ИИ-агента, который может заказывать еду, бронировать отели и покупать билеты. Ассистент не только находит нужную информацию, но и взаимодействует с веб-страницами.
▪ Что важно знать:
➡
Другие полезные ресурсы,
связанные с Operator и автоматизацией задач,
смотрите здесь.Читать полностью…
Громкие AI-новинки недели
Прошлая неделя принесла много интересных AI-решений: от мультимодальных моделей до инструмента для генерации видео. Подробнее о каждом читайте в карусели →
🤖 Как упростить себе жизнь в несколько раз.
На ежегодной выставке потребительской электроники CES 2025 показали гаджеты, которые могли бы заменить персонального ассистента или добавить пару свободных часов в ваш день.
→ Собрали в карусели то, что впечатлило нас больше всего
🕸 Спуфинг: угроза, которую нельзя игнорировать
В России набирает обороты такой вид мошенничества как спуфинг. Злоумышленники подделывают аккаунты, номера телефонов, сайты и даже голоса, чтобы завладеть конфиденциальной информацией или деньгами.
Чтобы понять, как российский бизнес оценивает риски спуфинга и готовится к защите, группа компаний Б1 и MTS AI провели исследование и опросили 39 представителей бизнеса. Среди участников более 60% — топ-менеджеры, а 50% представляют компании с численностью сотрудников от 1000 человек. Некоторые выводы смотрите на карточках.
→ Читать полную версию
Затопленный Диснейленд, папа римский в пуховике — вы тоже поверили?
С развитием Gen AI в соцсетях всё чаще появляются изображения и видео, которые сложно отличить от реальных. Чтобы разоблачать такие дипфейки, MTS AI совместно с VisionLabs создали сервис, который выявляет поддельные изображения, видео или аудио. А также распознаёт запрещённый контент, включая сцены с алкоголем, оружием, наркотиками и экстремизмом.
Ваше мнение:
Где такой сервис будет наиболее полезен?
🔥 — Для модерации контента в соцсетях и медиаплатформах
😄 — Для проверки безопасности в корпоративном секторе
👍 — Для борьбы с мошенничеством в телекоме
MTS AI
Врываемся в Новый год с поздравлениями 🥂❄️
Пусть 2025 год принесет еще больше вдохновляющих проектов и научных открытий! Обещаем следить за развитием ИИ и держать вас в курсе последних тенденций.
Спасибо, что были с нами, поддерживали, комментировали.
Ваш MTS AI 🤖
Новый год — новые традиции. Вспоминаем лучшие статьи наших экспертов на Хабре👇
🔴Как ускорить LLM-генерацию текста в 20 раз на больших наборах данных
🔴Промпт-инжиниринг: как найти общий язык с ИИ
🔴Как мы создали LLM-модель Cotype Nano
🔴Как создать ассистента для поиска по видео
🔴Есть ли жизнь до fit/predict?
🔴Оценка LLM с большим окном контекста
🔴Как за месяц научить нейросеть говорить на татарском
При выборе материалов мы ориентировались на ваши реакции. Благодарим каждого за поддержку ❤️
🌲 Порция новогоднего настроения от команды MTS AI
Мы решили поздравить вас с наступающими праздниками и сэкономить ваше время на поиски праздничной открытки, сгенерировав ее за вас.
Порадуйте ваших коллег и близких ❤
#MTSAI_news
Декабрьский марафон анонсов от OpenAI завершился — пора подводить итоги.
🎁 o1 и o1-mini
Теперь модели поддерживают работу с изображениями и голосовой режим Advanced Voice Mode. Обе версии можно адаптировать под конкретные задачи с помощью reinforcement fine-tuning (RFT), используя гораздо меньше данных, чем потребовалось бы раньше.
🎁 Обновления API o1
Добавили генерацию JSON-выводов, работу с изображениями и поддержку WebRTC, которая ускоряет интеграции в веб-приложения. Приятный бонус — снизили цену на Realtime API на 60%.
🎁 SORA Turbo
Обновленная версия SORA генерирует видео до 20 секунд. У подписчиков Pro доступ без ограничений до конца праздников.
🎁 Апдейты ChatGPT
Что добавили:
🔴Папки для хранения файлов
🔴Быстрый SearchGPT с голосовым режимом
🔴Режим Canvas для редактирования текста и кода прямо в интерфейсе
🔴Интеграцию с WhatsApp для звонков и переписок
🎁 o3 и o3-mini
Новые модели бьют рекорды по бенчмаркам и показывают результаты на уровне доктора наук: 87.5% на ARC AGI и 25% на Frontier Math.
Что попросим у Альтмана Санты в следующем году?
❤️ - новую модель
⚡️ - больше отдыхать в 2025 году
🚀 Как астронавты застряли на МКС? Почему Google Gemini путает исторические данные и генерирует людей с ошибками?
Ответы знает MIT Technology Review – они собрали список технологических провалов 2024 года.
➡ Смотрим и оцениваем в комментариях, что, по вашему мнению, заслуживает первого места.
🎄 До Нового года осталось меньше трёх недель, и все погрузились в предновогоднюю суету. Для кого-то это приятные хлопоты, а для кого-то — бесконечные дедлайны.
Мы запускаем серию опросов, чтобы узнать, как вы переживаете этот декабрь. А потом попросим LLM смоделировать общую картину предновогоднего настроения.
Как вам идея:
❤️ — супер, участвую
🔥 — и без опросов горим
MTS AI в топе работодателей для ИИ-специалистов! 🚀
🥉 TAdviser опубликовал рейтинг лучших компаний в сфере искусственного интеллекта, где мы заняли третье место.
Всего было опрошено 45 компаний. Нас обошли Яндекс Поиск и Сбер AI, в десятку также вошли Т-Банка, Лаборатория Касперского, VK, Avito, Cloud.ru, Озон Tech и Softline Digital.
Победителей определяли по пяти критериям, включая карьерное развитие, прокачку hard skills, участие в развитии сообщества и другие.
Еще немного интересной статистики:
сегодня 90% крупнейших компаний в России используют ИИ, при этом в среднем команды ML-разработчиков составляют 50 человек, а в корпорациях – 1000.
Чем ближе конец года, тем больше хороших новостей
Модель Cotype заняла второе место на MERA и обошла большинство конкурентов. Она вышла почти сразу после публикации T-Pro 🔥
📖📖Что нового в AI?
Делитесь интересными статьями и исследованиями в комментариях ⤵
▪ Humanity’s Last Exam — новый бенчмарк для LLM
Создан тест, который проверяет языковые модели на глубину понимания сложных тем и способность рассуждать. Он содержит 3000 сложных вопросов по математике, гуманитарным и естественным наукам. Пока лучшая точность — 9,4% (DeepSeek-R1), но ожидается, что к 2025 году модели превысят 50% → подробнее
▪ Как улучшить обработку длинных текстов
Учёные разработали Chain-of-Agents — фреймворк, который помогает языковым моделям лучше обрабатывать длинные тексты. Он разбивает их на части, распределяет между агентами, а затем собирает финальный ответ. Такой метод увеличивает точность на 10% → подробнее
▪ Может ли LLM планировать, как человек
Исследователи представили AoT+ — метод, который помогает языковым моделям лучше справляться с многозадачностью и сложными цепочками рассуждений. Благодаря ему модели уже показывает SOTA-результаты в тестах на логическое мышление → подробнее
▪ Agentic RAG — новый уровень поиска
Вышел обзор Agentic RAG — системы, где ИИ-агенты адаптируют стратегию поиска, анализируя контекст и корректируя запросы в реальном времени. Такой подход повышает точность извлечения информации и делает работу моделей более автономной, особенно в сложных задачах с длинным контекстом → подробнее
▪ Новый инструмент для оценки ИИ-ассистентов
Представлен IntellAgent — open-source фреймворк для тестирования разговорных систем ИИ. Он создаёт реалистичные сценарии, выявляет пробелы в их работе и помогает оптимизировать взаимодействие с пользователями → подробнее
#MTSAI_исследования
⚪ Cохраняйте инструкцию: как запустить DeepSeek R1 на компьютере
Китайская компания выпустила DeepSeek R1 — бесплатную модель с открытым кодом, которая уже обогнала ChatGPT по скачиваниям в AppStore.
В карусели рассказали, как установить модель на компьютер и защитить свои данные ➡️
Немного о DeepSeek:
🔴 Создана всего за $5,6 млн (это в 10 раз дешевле конкурентов, таких как GPT-4, Claude и LLaMA)
🔴 Показывает выдающиеся результаты в решении сложных математических задач, программировании и исправлении ошибок в коде
🔴 Требует в 50 раз меньше GPU (с 100 000 до 2 000)
🔴 Работает даже на игровых видеокартах
🔴 Разработана на чипах Nvidia H800, которые считаются менее мощными из-за экспортных ограничений США
Команды:
ollama -v
ollama run deepseek-r1:8b
▪️ Ваш гид в мир NLP
В феврале стартует бесплатный курс по обработке естественного языка от руководителя группы Kodify MTS AI, Валентина Малых. Программа подойдет как новичкам, так и тем, кто хочет углубить свои знания в этой области. Курс включает два блока:
1️⃣ Базовый: основы NLP — от классификации до генерации и от n-грамм до современных LLM.
2️⃣ Продвинутый: сложные задачи и узкие темы, включая диалоговые системы.
Что ждет студентов:
— Лекции от эксперта с 10-летним опытом в AI, кандидата технических наук Валентина Малых;
— Семинары и практические задачи для закрепления навыков.;
— Работа над собственным проектом — индивидуально или в команде;
— Тесты для проверки знаний и чат для общения и обсуждений.
➡️ Присоединяйтесь
📖📖Статьи и курсы, которые нельзя пропустить. Сохраняйте подборку, чтобы вернуться к ней позже.
🔴Архитектура Titan от Google
Google представили архитектуру Titan с многокомпонентной системой памяти и потенциальным контекстом более 2 млн токенов. Такое построение помогает модели решить проблему забывчивости моделей → Подробнее
🔴 Transformer2
В новой статье от Sakana AI показана архитектура Transformer2, которая адаптируется к новым задачам в реальном времени, изменяя только части весовых матриц. Она превосходит LoRA по эффективности и подходит для мультимодальных задач → Подробнее
🔴 Inference-Time Scaling для диффузии от Google
Ещё одна работа от Google, посвящённая test-time скейлингу в диффузии. Улучшение результатов достигается через поиск оптимального шума, а не увеличение шагов шумоподавления → Подробнее
🔴 Сертифицированный курс от Hugging Face
Hugging Face запускает бесплатный курс по созданию и настройке AI-агентов. Начало уже в феврале → Подробнее
🔴Обновленный курс по LLM от Large Language Model Course
Он подходит как для новичков, так и для тех, кто давно уже в ML. Для первых подготовлена отличная база с блоком по математике, Python и нейронным сетям; для последних — упор сделан на практику: учимся cоздавать, тренировать, строить LLM и интегрировать их в бизнес → Подробнее
⚡️ Новая открытая модель MiniCPM-o 2.6
OpenBMB представила MiniCPM-o 2.6 — мультимодальную модель с 8 миллиардами параметров. В ее основе – Qwen2.5-7B.
🧠 Модель умеет обрабатывать тексты, изображения, и аудио, используя:
— SigLip-400M для анализа изображений,
— Whisper-300M для обработки речи,
— ChatTTS-200M для синтеза голоса.
🔥 Производительность
MiniCPM-o 2.6 демонстрирует результаты выше GPT-4o, Gemini 1.5 Pro и Claude 3.5 Sonnet в задачах анализа одиночных изображений. Кроме того, она превосходит GPT-4o-202408 и Claude 3.5 Sonnet в обработке потоковых данных.
🎙 Другие возможности модели:
— Диалоги в реальном времени на английском и китайском,
— Клонирование голоса,
— Поддержка более 30 языков,
— Совместимость со смартфонами и iPad,
— Интеграция с популярными фреймворками: llama.cpp, vLLM, Gradio.
📂 Доступность
Веса и демо MiniCPM-o 2.6
🔥 Еще раз убеждаемся в мощности Qwen2.5. Кстати, именно на ее базе была создана Cotype Nano.
#MTSAI_LLM
Когда половина команды не вышла в офис и прислала пушистых друзей на созвон вместо себя. Как выглядят ваши будни после праздников? ⤵️
👍🏻 нет работы - нет проблем
🔥 уже давно в рабочем тонусе
Отправляйте в комментариях своих помощников 🐶
#фан
Что ждет вас в 2025?
Только звезды и LLM знают. Мы попросили Cotype поделиться предсказаниями, вот что из этого получилось 🤔
📺 Три, два, один — запускаем генератор
Сделайте скриншот и поделитесь результатом в комментариях ⤵️
🎉 Год близится к финалу 🎉
Ну что ж, подведем итоги 2024 года и вспомним, каким он был для команды MTS AI.
🔴Состоялся релиз 7 больших языковых моделей семейства Cotype и Kodify
🔴47 раз выступили на крупнейших конференциях для бизнеса и разработчиков ИИ: Finopolis, Conversations, Kazan Digital Week, AIJ, ЦИПР и Московский Финансовый форум и других.
🔴Организовали 17 собственных мероприятий, включая митапы по ML и NLP, а также вебинары про ИИ-решения для бизнеса.
🔴Выпустили 3 эпизода подкаста “ИИнсайт” – все выпуски слушайте тут.
🔴Опубликовали 6 статей на конференциях уровня Tier A — EMNLP, NeurlPS, CVPR, выиграли 10 конкурсов по ИИ, включая Image Matching Challenge от Google, AIDAO и другие.
🔴А также делились экспертизой на Хабре. Вот наши лучшие статьи.
С наступающими праздниками! И до встречи в Новом году.
Как создать AI-продукт, который приносит реальную пользу бизнесу?
В новом выпуске подкаста MTS AI «ИИнсайт» ведущий Леонид Саночкин поговорил с продакт-менеджерами Рушаной Гайнуллиной и Дарьей Самсоновой о том, как компании создают эффективные AI-решения.
Вы узнаете:
🔴 Чем отличаются подходы стартапов и корпораций в разработке AI
🔴 Как найти баланс между идеями исследователей и бизнес-целями
🔴 Что такое product vision и как его сформировать
🔴Можно ли оцифровать душу и создать AGI
➡ Слушайте подкаст на удобной платформе:
Telegram
Apple
Я.Музыка
VK
#MTSAI_подкаст
👾 ИИ в бизнесе: тренды и реальные кейсы
Какие AI-продукты действительно меняют бизнес? Что выбрать — разработку in-house или готовое решение? Какие навыки помогут построить карьеру в консалтинге AI?
В новом выпуске подкаста @r77_ai Дмитрий Черноус, руководитель группы пресейла и консалтинга MTS AI, отвечает на эти и другие вопросы.
📹 Смотрите полный выпуск
Ваш выбор:
Что действительно приносит результат?
👍 — Готовое AI-решение
🔥 — Разработка in-house
#MTSAI_News
Ребята из команды MTS AI снова вносят вклад в мировую науку 🎉
Две наши работы приняли на ECIR 2025 — одну из крупнейших международных конференций по информационному поиску.
→ Первая статья посвящена улучшению генерации кода. Исследователи разработали метод, который с помощью переранжирования и итеративного самообучения (PPO) повторно оценивает данные, исправляет ошибки и включает их в обучение. Это сделало 13-миллиардную модель быстрее, точнее и сравнимой по производительности с GPT-4.
→ Вторая статья описывает фреймворк RURAGE для оценки QA-систем. Он объединяет текстовый анализ, модели и метрики неопределенности, достигая точности уровня дорогостоящих методов вроде LLM-as-a-judge, но остается доступным и быстрым.
Ссылки на исследования обязательно поделимся чуть позже.
❤️ — гордимся командой и с нетерпением ждем конференции в солнечной Тоскане в апреле
#MTSAI_news
Новый ресерч от MTS AI
На EMNLP 2024 — входит в топ-3 международных конференции по NLP — команда MTS AI представила результаты двух новых исследований.
→ Первое предлагает снизить затраты на обучение языковых моделей с помощью адаптеров. Эти дополнительные слои уменьшают вычислительную нагрузку, сохраняя точность работы модели. Подход протестирован на задачах классификации текста и определения именованных сущностей. Время цикла активного обучения сократилось на 20%.
→ Второе посвящено системе Efficient Answer Retrieval System (EARS), которая объединяет локальные базы данных с генеративными моделями. EARS позволяет эффективно отвечать на фактологические и специализированные вопросы и минимизировать ошибки благодаря гибридному подходу. В тестах система повысила точность ответов на 92,8% и увеличила производительность в 7 раз.
Обе технологии уже внедряются в коммерческие продукты и решения MTS AI. Они могут применяться в таких сферах, как ритейл и телекоммуникации, где требуется скорость и эффективность обработки данных.
Подробнее:
🔗 Ссылка на исследование обучения LLM c помощью адаптеров
🔗 Ссылка на исследование EARS
🎄 До Нового года осталось меньше трёх недель, и все погрузились в предновогоднюю суету. Для кого-то это приятные хлопоты, а для кого-то — бесконечные дедлайны.
Мы запускаем серию опросов, чтобы узнать, как вы переживаете этот декабрь. А потом попросим LLM смоделировать общую картину предновогоднего настроения.
Как вам идея:
❤️ — супер, участвую
🔥 — и без опросов горим на работе
Как работают нейросети? Почему искусственный интеллект помогает экологии? И зачем вообще ИИ учить этике?
Ответы на эти (и не только) вопросы можно найти учебниках по искусственному интеллекту для школьников 🔥 И да, MTS AI внесла свой вклад в их создание и написала главы про то, как компьютер может "видеть", "слышать" и понимать человеческую речь. Эти темы стали частью пособия для 5–6 классов.
📚 Учебники презентовали на AI Journey, а в 2025 году они появятся в школах по всей стране.
🤖 OpenAI представила Sora — новую ИИ-модель для генерации видео высокого качества.
Она умеет:
— Генерировать видео из текстового запроса всего за 20–120 секунд.
— Создавать сториборды, объединяя несколько текстовых запросов в единую историю.
— Добавлять эффекты, анимировать изображения и дорабатывать готовые видеоматериалы.
🧑💻 Интерфейс модели отличается удобством — в нем есть встроенная галерея и система сохранений.
🤝 Из минусов: модель пока доступна не всем, есть ограничения по генерации и строгая модерация.
Запасаемся терпением, для удачного ролика потребуется не один десяток генераций и подписка Pro за $200 — она позволит создавать видео до 20 секунд, в максимальном разрешении, без водяных знаков.
❤️ — Что ж, дадим модели шанс!