Мы разрабатываем решения и продукты на базе технологий NLP, CV и Gen AI. Формируем AI-сообщество, сотрудничаем с ведущими технологическими компаниями и экспертами, проводим исследования, инвестируем в перспективные проекты и команды.
▪️ Прежде чем внедрять ИИ, убедитесь, что ваш бизнес к этому готов.
Без этого даже самые передовые технологии не дадут результата. В карусели разобрали три ключевых шага, которые помогут подготовить компанию к работе с ИИ.
А 12 и 14 марта на интенсиве расскажем, как избежать ошибок и правильно внедрять ИИ в бизнес-процессы.
🎁 Бонусы: участники получат чек-лист «Готовность бизнеса к ИИ» + составят пошаговый план "Как улучшить ваши процессы и продукты с помощью ИИ".
➡️ Регистрируйтесь
Как бизнес использует RAG? Разобрали основные сценарии →
RAG (Retrieval-Augmented Generation) — технология, которая объединяет поиск и генерацию текста, помогая нейросетям извлекать актуальную информацию из корпоративных баз данных и формировать точные ответы.
▪ Как бизнес зарабатывает на ИИ?
По данным исследования Forrester, 62% компаний планируют увеличить инвестиции в искусственный интеллект в ближайший год.
В программе:
— актуальные тренды применения ИИ в бизнесе;
— разбор реальных кейсов, где ИИ уже приносит экономический эффект;
— практические инструменты оценки ИИ-зрелости компании;
— готовые инструменты расчета ROI и других метрик.
▪ Anthropic выпустила Claude 3.7 Sonnet — обновленную модель для кодинга и рассуждений.
Что нового:
🔴одним из ключевых улучшений стала работа с кодом и фронтенд-разработкой. В API доступна настройка глубины размышлений;
🔴появился Claude Code — CLI-инструмент для работы с кодом. Он помогает анализировать, тестировать, редактировать файлы, коммитить изменения в GitHub и работать с командной строкой. Пока доступен в тестовом режиме;
🔴улучшена фильтрация запросов: на 45% точнее модель различает вредоносные и безопасные обращения;
🔴в кодинге Claude 3.7 Sonnet значительно опережает OpenAI o3-mini-high и Grok 3 в SWE-bench Verified на автономное написание кода, но уступает в математических бенчмарках MATH 500 и AIME 2024;
🔴 модель оптимизирована под реальные бизнес-кейсы, а не академические задачи и тесты.
Протестировать Claude 3.7 Sonnet можно бесплатно здесь, рассуждающий режим доступен только по подписке.Читать полностью…
Как забыть о спаме, трекерах и нежелательных звонках?
Только за последний год 67% россиян получали звонки от телефонных мошенников, а 17% — спам-СМС. Данные утекли, номер попал в базу — и вот вам уже звонят из «службы безопасности банка».
Как защититься? Коллеги из Future Crew создали тариф Membrana, который берет под контроль вашу приватность и безопасность в сети.
Его преимущества:
🔴Блокирует спам, трекеры и нежелательные звонки;
🔴Записывает и сохраняет диалоги с помощью ИИ-секретаря;
🔴Следит за утечками данных и предупреждает о рисках;
🔴Создает виртуальные номера, чтобы спрятать контактные данные.
А главное — вы сами решаете, кто может вам звонить, а кто — нет.
❤️ — Определенно нужная фича!
Хотите разобраться, как работают системы защиты от мошенников, дипфейков и утечек данных → заглядывайте сюда.
▪ Может ли ИИ заменить разработчиков? OpenAI проверили на реальных деньгах.
OpenAI представили SWE-Lancer — новый бенчмарк, который оценивает не только код, а его реальный экономический эффект.
Как проверяли:
— взяли 1488 реальных задач с Upwork разной стоимости и сложности;
— проверили, какие из них могут выполнить LLM;
— посчитали, сколько денег “заработают” модели.
Результаты:
— Claude 3.5 Sonnet — $403 000;
— o1 high compute — $380 000;
— GPT-4o — $304 000.
🤔 Пока ни одна модель не справляется с фриланс-задачами на уровне человека, но цифры впечатляют: LLM уже могут выполнять до 40% заказов.
Следующий шаг — OpenAI планируют использовать SWE-Lancer не только для оценки возможностей ИИ, но и для анализа безопасности автономных AI-агентов в программировании.
➡ Читайте полное исследование
Ваше мнение: когда ИИ догонит фриланс-разработчиков?
📞 Сможете отличить поддельный голос от настоящего? Что, если AI уже научился делать это лучше вас?
На вебинаре 25 февраля в 11:00 по мск вместе с экспертами MTS AI:
— проверим, как работают технологии распознавания дипфейков;
— покажем реальные примеры атак;
— разберем, можно ли создать 100% надежную защиту.
➡ Занимайте место по ссылке
💻 Я люблю работу в IT за...
В мире IT каждый день — это новый вызов, но и поводов для радости хватает. Мы спросили коллег, за что они любят свою работу и без чего её уже не представляют. Ответы — в карточках 😉
А ещё сегодня отличный повод сказать тёплые слова друзьям и коллегам. Под этим постом можно сгенерировать валентинку и отправить её тем, кто спасал вас от багов, дедлайнов и пятничных релизов.
❤️— со всех, кто любит свою работу
7 ИИ-решений, которые меняют банковскую сферу
Наша команда представила сервисы, которые делают банковские процессы быстрее, удобнее и эффективнее.
Чат-боты, голосовые ассистенты, речевая аналитика для контроля качества общения, LLM-системы для автоматизации документооборота и анализа клиентских данных помогают ускорить обслуживание, снизить издержки и повысить лояльность клиентов.
Разбираем подробнее, как они работают в карусели →
💾 Любовь на языке IT – это…
Мы тут решили поискать ответ в любимых мемах и среди участников провести небольшой розыгрыш.
Что для этого нужно сделать:
→ Зайти в бот MTS AI
→ Сгенерировать валентинку *
→ Сделать скрин и опубликовать его в комментарии к посту
Среди тех, кто выполнит все условия, мы случайным образом разыграем 3 годовые подписки на Telegram Premium. 18 февраля выберем трех счастливчиков. Полные правила конкурса читайте тут.
* Валентинку можно отправить второй половинке, другу, подруге, маме и даже коту ❤️Читать полностью…
🌐 Новые Gemini 2.0: мощнее, умнее, дешевле
Google представила три новые модели Gemini 2.0 и запустила Flash Thinking — "думающую" нейросеть, аналог OpenAI o3 и DeepSeek-R1. Пока они поддерживают только текст, но в ближайшие месяцы компания обещает добавить изображения, аудио и видео в версии Flash и Pro.
Что нового:
🔴Gemini 2.0 Flash — быстрая, производительная, дешевая модель в своем весе с контекстным окном до 1 млн токенов, теперь доступна всем желающим через приложение Gemini.
🔴Gemini 2.0 Flash-Lite — самый экономичный вариант для разработчиков, доступна через API.
🔴Gemini 2.0 Pro — мощная экспериментальная версия с контекстным окном 2 млн токенов (в 2 раза больше, чем у Flash).
По бенчмаркам Gemini 2.0 Pro обходит все прошлые версии:
🔴MATH – 91,8% (лучший результат)
🔴HiddenMath – 65,2% (значительное улучшение)
🔴SimpleQA – 44,3% (против 29,9% у Flash и 30,1% у DeepSeek-R1)
Интересно: Google снизила стоимость генерации контента для моделей Flash и Flash-Lite. Означает ли это, что нейросети станут доступнее, а цена на рассуждающие модели продолжит снижаться?
▪ Дипфейки вышли на новый уровень. Кто под ударом в 2025 году? Спойлер: почти все.
Голосовые подделки, фальшивые документы и биометрические атаки — технологии становятся умнее, а вместе с ними и мошенники. Мы в MTS AI и VisionLabs запустили канал, где разбираем самые острые темы: от взломов банков по голосу до цифровых двойников в кино.
Что уже можно почитать:
— как защититься от мошенников, не выходя из Telegram
— как работает биометрия — основные термины
— подменили ли Пола Маккартни — похоже, что нет.
⚡️ Неделя апдейтов китайских моделей
Alibaba представила новую версию своей мультимодальной модели Qwen2.5-VL. Она доступна в трех вариантах: 3B, 7B и 72B параметров и может выступать в роли ИИ-агента, аналогично Operator.
▪ Модель способна:
▪ Бенчмарки
Теперь выполнять рутинные задачи стало проще
OpenAI представили Operator — ИИ-агента, который может заказывать еду, бронировать отели и покупать билеты. Ассистент не только находит нужную информацию, но и взаимодействует с веб-страницами.
▪ Что важно знать:
➡
Другие полезные ресурсы,
связанные с Operator и автоматизацией задач,
смотрите здесь.Читать полностью…
Освобождайте слот в календаре 👍
12 марта в 18:30 проведём первый в этом году NLP Meetup в офисе MTS AI. Встреча будет посвящена Natural Language Processing (NLP).
В программе:
— Иван Сидоров, "Автоматическая валидация RAG. Разбираем на практике".
— Дарья Самсонова, "Методы оценки качества выборки в нашем продукте AutoML".
В выходные у меня амбициозные планы 👇
испечь блинов,
разобрать свежие исследования по ИИ.
Может ли LLM с 1 миллиардом параметров обойти LLM c 405 миллиардами?
Всем привет, сегодня хотел обсудить статью с многообещающим названием "Can 1B LLM Surpass 405B LLM?".
забегая вперед, ответ - да (можно увидеть на картинке 1), конечно, с оговоркой, что на некоторых задачах и при определенных условиях
что за задачи и условия? об этом и поговорим; задач в статье рассмотрено две, точнее два набора задач - MATH-500 и AIME24
MATH-500 - это 500 математических задач уровня старшей школы, которые предназначены для решения школьниками в классе, AIME24 - это 24 олимпиадных задачи также уровня старшей школы; в последнее время эти два набора стали популярны для оценки моделей по математике
выбор из нескольких параллельно сгенерированных вариантов (Best of N, BoN), построения дерева рассуждений (Beam Search) и выбор из нескольких таких деревьев (Diverse Verifier Tree Search, DVTS), они все показаны на картинке 2; у каждого из этих вариантов есть свои гиперпараметры, например, количество вариантов для BoN или деревьев для DVTS
на этой оптимистической ноте я бы хотел закончить свой рассказ; в комментариях накидывайте варианты статей для будущих разборов 🔚Читать полностью…
📹 Уже в эфире! Разбираем дипфейки на реальных примерах.
Подключайтесь по ссылке :) За лучший вопрос в чате — плед от команды MTS AI 🎁
#MTSAI_events
🧬 Будущее науки в руках ИИ?
Google представил AI co-scientist — ИИ-агента на базе Gemini 2.0, который помогает ученым анализировать огромные массивы данных, генерировать гипотезы и ускорять научные открытия.
Помощник уже предложил новые способы лечения фиброза печени и нашёл альтернативное применение существующим лекарствам от лейкемии.
Конфликт юрисдикций в эпоху ИИ. В Индии набирает обороты судебный спор против OpenAI.
В конце 2024 года индийское новостное агентство ANI подало иск против OpenAI, обвинив компанию в незаконном использовании авторского контента при обучении ИИ-моделей. Истцы требуют удалить их материалы из уже обученной модели и выплатить компенсацию в $230 000. К иску уже присоединились Ассоциация издателей цифровых новостей (DNPA), Indian Express и Hindustan Times.
Позиция СМИ:
– OpenAI использует защищённый авторским правом контент без разрешения.
- Компания не имеет лицензионных соглашений с индийскими СМИ, в отличие от некоторых международных партнёров.
– Действия OpenAI угрожают авторским правам издателей и наносят ущерб их бизнесу, усиливая доминирование технологических корпораций в распределении контента и рекламных доходов.
Позиция OpenAI:
– Удаление данных технически почти невозможно. Даже если компания исключит определённые тексты из будущих версий, предыдущие релизы останутся «загрязнёнными».
– Запрос истцов противоречит законодательству США, включая принципы добросовестного использования (fair use) и условия хранения информации, предусмотренные Digital Millennium Copyright Act (DMCA).
Текущий статус:
Высокий суд Дели рассматривает вопрос о юрисдикции. OpenAI утверждает, что индийские суды не могут рассматривать иск, поскольку серверы и обучение моделей находятся за пределами Индии. Однако суд назначил слушания на февраль 2025 года, чтобы оценить аргументы о доступности ChatGPT в Индии и применимости местного законодательства.
Попросили прокомментировать старшего юриста MTS AI Кирилла Дьякова:
Как может разрешиться спор?
Индия применяет смешанную систему права, поэтому судья, вероятно, опираясь на прецедент с Telegram (2022), признает юрисдикцию местных судов, несмотря на иностранные серверы OpenAI. Это вынудит компанию либо договариваться с истцами, либо искать технические решения для удаления данных.
Что ждёт ИИ-индустрию?
1. Каждая страна, защищая свой «юридический суверенитет», будет вводить новые регуляторные нормы, опираясь на судебную практику и мировой опыт.
2. Разработчикам ИИ придётся:
– Вести реестры данных, используемых для обучения моделей.
– Заключать лицензионные соглашения с правообладателями.
– Разрабатывать методы «забывания» данных (machine unlearning), что станет критически важным.
⚪ Коллеги, есть разговор
Мы решили, что об ИИ никто не расскажет лучше, чем человек, который разбирается в теме и двигает науку вперед. Поэтому провели тщательный отбор и выбрали идеального кандидата в авторы (имя пока держим в секрете 🙊).
Вот что нам о нем известно:
🔴 Руководит исследованиями в области NLP
🔴 Преподает в топовых вузах и готовит будущих ИИ-специалистов
🔴Автор 100+ научных работ, опубликованных на ведущих AI-конференциях
🔴 Входит в Научный совет Альянса в сфере искусственного интеллекта
Выбираем, какую исследовательскую статью он разберет в следующую среду ⤵
🔗 1
🔗 2
🔗 3
Можно ли научить ИИ рассуждать, как программист?
🧑💻DeepSeek представила CodeI/O — метод, который помогает языковым моделям (LLM) осваивать логику программирования и развивать навыки рассуждений, анализируя код.
🔬 Для обучения исследователи собрали 810 000 примеров кода на Python, включая задачи по математике, логике и алгоритмам. Затем код трансформировали в формат ввода-вывода, протестировали с помощью DeepSeek-V2.5 и добавили пошаговые объяснения по методу Chain-of-Thought.
📊 Улучшенная версия CodeI/O++ показала, что ИИ может самостоятельно разбираться в сложных задачах благодаря механизму обратной связи (если ответ неверный, модель получает объяснение ошибки и пробует снова).
GitHub | Исследование
Meta* научилась предсказывать текст по сигналам мозга
Компания представила Brain2Qwerty — ИИ, который расшифровывает мысли без имплантов и операций. Подробнее о том, как он работает и какие результаты показывает, читайте на карточках →
Спойлер: средняя ошибка Brain2Qwerty составила 67% (на EGG), а у отдельной категории участников эксперимента — 19%.
Как оцениваете технологию?
*признана экстремистской организацией и запрещена в РФЧитать полностью…
Цифровые двойники повсюду
Их жертвами становятся не только бабушки и дедушки в России, но и даже итальянская элита, включая президента Prada Патрицио Бертелли, модельера Джорджио Армани и миллиардера Массимо Моратти.
Как распознать поддельный голос и не попасться на удочку мошенников? Расскажем 25 февраля в 11:00 на вебинаре MTS AI.
А также разберем:
🔴 как работают технологии создания и распознавания поддельных голосов;
🔴 как AI обучается выявлять дипфейки;
🔴 как на практике защититься от мошенников.
🎓 С Днем российской науки!
Да, официально праздник — 8 февраля, но мы не можем уйти на выходные, не поделившись важной мыслью: в науке решает не количество публикаций, а живой обмен знаниями, участие в конференциях и дискуссиях. Особенно в области AI.
Дарья Галимзянова, NLP-разработчик в MTS AI, написала на Хабре подробный гид, как попасть на научную конференцию со своей статьей. Как выбрать подходящее событие? Когда начинать готовиться? Почему вашу статью могут не принять? Миллион нюансов — и все с пошаговым разбором.
📖 Читайте и ставьте ❤️ , если узнали кадр из фильма.
🔥 Этот год для ИИ-агентов обещает быть жарким
OpenAI представила Deep Research — ИИ-агента, который автономно проводит исследования и решает сложные задачи.
Что важно знать:
🔴 Работает на "рассуждающей" модели o3.
🔴 Сочетает в себе возможности веб-браузинга, анализирует, прикрепленные файлы и выполняет Python-скриптов.
🔴 В основе лежит принцип автономного планирования исследования — уточняет вопросы, отбирает источники.
🔴 Обрабатывает сотни текстов, изображений и PDF-документов.
🔴 Генерирует подробный отчет за 10–30 минут.
🔴 В тесте Humanity’s Last Exam набирает 26,6% — в 12 раз лучше Grok-2 и GPT-4o.
🔴Доступен для пользователей ChatGPT Pro.
Ваше мнение:
Deep Research — это
🔥 — шаг на пути к AGI
⚡️ — очередная надстройка для LLM
📖📖Что нового в AI?
Делитесь интересными статьями и исследованиями в комментариях ⤵
▪ Humanity’s Last Exam — новый бенчмарк для LLM
Создан тест, который проверяет языковые модели на глубину понимания сложных тем и способность рассуждать. Он содержит 3000 сложных вопросов по математике, гуманитарным и естественным наукам. Пока лучшая точность — 9,4% (DeepSeek-R1), но ожидается, что к 2025 году модели превысят 50% → подробнее
▪ Как улучшить обработку длинных текстов
Учёные разработали Chain-of-Agents — фреймворк, который помогает языковым моделям лучше обрабатывать длинные тексты. Он разбивает их на части, распределяет между агентами, а затем собирает финальный ответ. Такой метод увеличивает точность на 10% → подробнее
▪ Может ли LLM планировать, как человек
Исследователи представили AoT+ — метод, который помогает языковым моделям лучше справляться с многозадачностью и сложными цепочками рассуждений. Благодаря ему модели уже показывает SOTA-результаты в тестах на логическое мышление → подробнее
▪ Agentic RAG — новый уровень поиска
Вышел обзор Agentic RAG — системы, где ИИ-агенты адаптируют стратегию поиска, анализируя контекст и корректируя запросы в реальном времени. Такой подход повышает точность извлечения информации и делает работу моделей более автономной, особенно в сложных задачах с длинным контекстом → подробнее
▪ Новый инструмент для оценки ИИ-ассистентов
Представлен IntellAgent — open-source фреймворк для тестирования разговорных систем ИИ. Он создаёт реалистичные сценарии, выявляет пробелы в их работе и помогает оптимизировать взаимодействие с пользователями → подробнее
#MTSAI_исследования
⚪ Cохраняйте инструкцию: как запустить DeepSeek R1 на компьютере
Китайская компания выпустила DeepSeek R1 — бесплатную модель с открытым кодом, которая уже обогнала ChatGPT по скачиваниям в AppStore.
В карусели рассказали, как установить модель на компьютер и защитить свои данные ➡️
Немного о DeepSeek:
🔴 Создана всего за $5,6 млн (это в 10 раз дешевле конкурентов, таких как GPT-4, Claude и LLaMA)
🔴 Показывает выдающиеся результаты в решении сложных математических задач, программировании и исправлении ошибок в коде
🔴 Требует в 50 раз меньше GPU (с 100 000 до 2 000)
🔴 Работает даже на игровых видеокартах
🔴 Разработана на чипах Nvidia H800, которые считаются менее мощными из-за экспортных ограничений США
Команды:
ollama -v
ollama run deepseek-r1:8b
▪️ Ваш гид в мир NLP
В феврале стартует бесплатный курс по обработке естественного языка от руководителя группы Kodify MTS AI, Валентина Малых. Программа подойдет как новичкам, так и тем, кто хочет углубить свои знания в этой области. Курс включает два блока:
1️⃣ Базовый: основы NLP — от классификации до генерации и от n-грамм до современных LLM.
2️⃣ Продвинутый: сложные задачи и узкие темы, включая диалоговые системы.
Что ждет студентов:
— Лекции от эксперта с 10-летним опытом в AI, кандидата технических наук Валентина Малых;
— Семинары и практические задачи для закрепления навыков.;
— Работа над собственным проектом — индивидуально или в команде;
— Тесты для проверки знаний и чат для общения и обсуждений.
➡️ Присоединяйтесь