Мы разрабатываем решения и продукты на базе технологий NLP, CV и Gen AI. Формируем AI-сообщество, сотрудничаем с ведущими технологическими компаниями и экспертами, проводим исследования, инвестируем в перспективные проекты и команды.
▪ 6 вопросов об ИИ-агентах
Спросили тайного редактора, почему ИИ-агентов нельзя назвать совершенно новой технологией, какие задачи они уже могут выполнять, а где пока бессильны, и главное — каков следующий шаг развития агентского ИИ.
▪️ Как отличить ИИ-агента от обычной ИИ-системы?
Главное — автономность. Если система сама принимает решения и выполняет задачи без подтверждения — это агент.
Это маркетинговая упаковка существующих технологий. Прорыва тут нет.
Так сразу и не определишь.
— Автономные программы и диалоговые системы развиваются где‑то с 1960–1970-х.
— Новый же виток развития ИИ-агентов — на основе LLM с доступом к внешним инструментам — начался 3 года назад.
Они усилили возможности агентов, но не сделали их с нуля. Это скорее эволюция инструментов, а не революция.
Простые задачи типа поставить будильник? — ок.
Записать к парикмахеру? — 50/50.
Всё зависит от уровня автоматизации и сложности процессов. В более сложных задачах больше переменных, оттого они и решаются с переменным успехом.
Пока ИИ-агенты на ранней стадии развития (несколько затянувшейся). Но все идёт к тому, чтобы научить агентов взаимодействовать друг с другом. Тогда можно будет говорить о полноценной автоматизации бизнес-процессов.
POV: Когда попытался разобраться в процессах самостоятельно — но не получилось
😁 Предложили готовое решение
Такое не пропускаем!
Подобрали три крутых AI-курса, которые помогут прокачаться в NLP, LLM и Deep Learning.
1⃣ Практический курс по NLP и MarkUp от red_mad_robot
4 недели интенсивной практики с экспертами по двум направлениям:
— NLP-инженер: работа с LLM (ChatGPT, Claude и другими), настройка промптов, обработка данных.
— MarkUp-инженер : разметка данных, генерация контента, интеграция с нейросетями.
➡ Приём заявок до 10 марта. Старт — 17 марта.
2⃣ Обновлённый курс Hugging Face по NLP и LLM. Добавили главу про reasoning:
— Reinforcement learning и его роль в обучении LLM.
— Разбор статьи про R1.
— Практическая часть: работа с библиотекой TRL и применение метода GRPO.
— Квизы после каждой главы.
➡ Гитхаб| Курс
3⃣ Легендарный вводный курс от MIT по Deep Learning. Перезапуск
— Базовые знания по методам глубокого обучения, NLP, CV, LLM: разбор теории и практика.
— Подойдёт даже для новичков, главное — знать основы математики.
— Лекции выходят на YouTube с 3 марта, первая уже доступна по ссылке
➡ Программа курса тут.
Сохраняйте 👍
▪️ Прежде чем внедрять ИИ, убедитесь, что ваш бизнес к этому готов.
Без этого даже самые передовые технологии не дадут результата. В карусели разобрали три ключевых шага, которые помогут подготовить компанию к работе с ИИ.
А 12 и 14 марта на интенсиве расскажем, как избежать ошибок и правильно внедрять ИИ в бизнес-процессы.
🎁 Бонусы: участники получат чек-лист «Готовность бизнеса к ИИ» + составят пошаговый план "Как улучшить ваши процессы и продукты с помощью ИИ".
➡️ Регистрируйтесь
Как бизнес использует RAG? Разобрали основные сценарии →
RAG (Retrieval-Augmented Generation) — технология, которая объединяет поиск и генерацию текста, помогая нейросетям извлекать актуальную информацию из корпоративных баз данных и формировать точные ответы.
▪ Как бизнес зарабатывает на ИИ?
По данным исследования Forrester, 62% компаний планируют увеличить инвестиции в искусственный интеллект в ближайший год.
В программе:
— актуальные тренды применения ИИ в бизнесе;
— разбор реальных кейсов, где ИИ уже приносит экономический эффект;
— практические инструменты оценки ИИ-зрелости компании;
— готовые инструменты расчета ROI и других метрик.
▪ Anthropic выпустила Claude 3.7 Sonnet — обновленную модель для кодинга и рассуждений.
Что нового:
🔴одним из ключевых улучшений стала работа с кодом и фронтенд-разработкой. В API доступна настройка глубины размышлений;
🔴появился Claude Code — CLI-инструмент для работы с кодом. Он помогает анализировать, тестировать, редактировать файлы, коммитить изменения в GitHub и работать с командной строкой. Пока доступен в тестовом режиме;
🔴улучшена фильтрация запросов: на 45% точнее модель различает вредоносные и безопасные обращения;
🔴в кодинге Claude 3.7 Sonnet значительно опережает OpenAI o3-mini-high и Grok 3 в SWE-bench Verified на автономное написание кода, но уступает в математических бенчмарках MATH 500 и AIME 2024;
🔴 модель оптимизирована под реальные бизнес-кейсы, а не академические задачи и тесты.
Протестировать Claude 3.7 Sonnet можно бесплатно здесь, рассуждающий режим доступен только по подписке.Читать полностью…
Как забыть о спаме, трекерах и нежелательных звонках?
Только за последний год 67% россиян получали звонки от телефонных мошенников, а 17% — спам-СМС. Данные утекли, номер попал в базу — и вот вам уже звонят из «службы безопасности банка».
Как защититься? Коллеги из Future Crew создали тариф Membrana, который берет под контроль вашу приватность и безопасность в сети.
Его преимущества:
🔴Блокирует спам, трекеры и нежелательные звонки;
🔴Записывает и сохраняет диалоги с помощью ИИ-секретаря;
🔴Следит за утечками данных и предупреждает о рисках;
🔴Создает виртуальные номера, чтобы спрятать контактные данные.
А главное — вы сами решаете, кто может вам звонить, а кто — нет.
❤️ — Определенно нужная фича!
Хотите разобраться, как работают системы защиты от мошенников, дипфейков и утечек данных → заглядывайте сюда.
▪ Может ли ИИ заменить разработчиков? OpenAI проверили на реальных деньгах.
OpenAI представили SWE-Lancer — новый бенчмарк, который оценивает не только код, а его реальный экономический эффект.
Как проверяли:
— взяли 1488 реальных задач с Upwork разной стоимости и сложности;
— проверили, какие из них могут выполнить LLM;
— посчитали, сколько денег “заработают” модели.
Результаты:
— Claude 3.5 Sonnet — $403 000;
— o1 high compute — $380 000;
— GPT-4o — $304 000.
🤔 Пока ни одна модель не справляется с фриланс-задачами на уровне человека, но цифры впечатляют: LLM уже могут выполнять до 40% заказов.
Следующий шаг — OpenAI планируют использовать SWE-Lancer не только для оценки возможностей ИИ, но и для анализа безопасности автономных AI-агентов в программировании.
➡ Читайте полное исследование
Ваше мнение: когда ИИ догонит фриланс-разработчиков?
📞 Сможете отличить поддельный голос от настоящего? Что, если AI уже научился делать это лучше вас?
На вебинаре 25 февраля в 11:00 по мск вместе с экспертами MTS AI:
— проверим, как работают технологии распознавания дипфейков;
— покажем реальные примеры атак;
— разберем, можно ли создать 100% надежную защиту.
➡ Занимайте место по ссылке
💻 Я люблю работу в IT за...
В мире IT каждый день — это новый вызов, но и поводов для радости хватает. Мы спросили коллег, за что они любят свою работу и без чего её уже не представляют. Ответы — в карточках 😉
А ещё сегодня отличный повод сказать тёплые слова друзьям и коллегам. Под этим постом можно сгенерировать валентинку и отправить её тем, кто спасал вас от багов, дедлайнов и пятничных релизов.
❤️— со всех, кто любит свою работу
7 ИИ-решений, которые меняют банковскую сферу
Наша команда представила сервисы, которые делают банковские процессы быстрее, удобнее и эффективнее.
Чат-боты, голосовые ассистенты, речевая аналитика для контроля качества общения, LLM-системы для автоматизации документооборота и анализа клиентских данных помогают ускорить обслуживание, снизить издержки и повысить лояльность клиентов.
Разбираем подробнее, как они работают в карусели →
💾 Любовь на языке IT – это…
Мы тут решили поискать ответ в любимых мемах и среди участников провести небольшой розыгрыш.
Что для этого нужно сделать:
→ Зайти в бот MTS AI
→ Сгенерировать валентинку *
→ Сделать скрин и опубликовать его в комментарии к посту
Среди тех, кто выполнит все условия, мы случайным образом разыграем 3 годовые подписки на Telegram Premium. 18 февраля выберем трех счастливчиков. Полные правила конкурса читайте тут.
* Валентинку можно отправить второй половинке, другу, подруге, маме и даже коту ❤️Читать полностью…
🌐 Новые Gemini 2.0: мощнее, умнее, дешевле
Google представила три новые модели Gemini 2.0 и запустила Flash Thinking — "думающую" нейросеть, аналог OpenAI o3 и DeepSeek-R1. Пока они поддерживают только текст, но в ближайшие месяцы компания обещает добавить изображения, аудио и видео в версии Flash и Pro.
Что нового:
🔴Gemini 2.0 Flash — быстрая, производительная, дешевая модель в своем весе с контекстным окном до 1 млн токенов, теперь доступна всем желающим через приложение Gemini.
🔴Gemini 2.0 Flash-Lite — самый экономичный вариант для разработчиков, доступна через API.
🔴Gemini 2.0 Pro — мощная экспериментальная версия с контекстным окном 2 млн токенов (в 2 раза больше, чем у Flash).
По бенчмаркам Gemini 2.0 Pro обходит все прошлые версии:
🔴MATH – 91,8% (лучший результат)
🔴HiddenMath – 65,2% (значительное улучшение)
🔴SimpleQA – 44,3% (против 29,9% у Flash и 30,1% у DeepSeek-R1)
Интересно: Google снизила стоимость генерации контента для моделей Flash и Flash-Lite. Означает ли это, что нейросети станут доступнее, а цена на рассуждающие модели продолжит снижаться?
📹 Мы в эфире! Разбираем ключевые тренды и кейсы применения ИИ в бизнесе.
Что вас ждёт:
🔴Практические примеры внедрения ИИ
🔴 Готовые решения для старта
🔴 Пошаговый план поиска возможностей
🔗 Подключайтесь по ссылке :) Будет много практики. В конце первого дня у вас будет чёткое понимание, как улучшить процессы и продукты с помощью ИИ.
#MTSAI_events
Женщины в IT: избавляемся от стереотипов вместе 💪✨
Они знают, что такое перцептрон, защищают кандидатские, решают вопросы с разработкой сложных AI-продуктов и не хотят быть «украшением коллектива». Это все – про девушек в IT. Четвертый выпуск подкаста ИИнсайт мы решили сделать чисто женским...
🌷 Смотрим и обсуждаем:
— как девушкам строить карьеру в IT;
— какие стереотипы до сих пор существуют и как с ними справляться;
— можно ли достичь баланса в работе и личной жизни;
— каково быть женщиной-руководителем в AI-сфере.
🎧 Выпуск доступен:
VK Видео
Rutube
Telegram-плеер
Apple Podcasts
❤️ Поддержим наших участниц и пожелаем всем девушкам в этот день цветов, тепла и счастья!
Креатив требует человека?!
MTS AI и Агентство креативных индустрий Москвы выяснили, как дизайнеры, художники, маркетологи и специалисты в сфере моды используют ИИ.
Ключевые цифры:
— 43% респондентов уже регулярно работают с нейросетями.
— 92% планируют использовать ИИ чаще.
— 68% в целом положительно относятся к технологиям, причем среди активных пользователей это процент больше — 88%.
Освобождайте слот в календаре 👍
12 марта в 18:30 проведём первый в этом году NLP Meetup в офисе MTS AI. Встреча будет посвящена Natural Language Processing (NLP).
В программе:
— Иван Сидоров, "Автоматическая валидация RAG. Разбираем на практике".
— Дарья Самсонова, "Методы оценки качества выборки в нашем продукте AutoML".
В выходные у меня амбициозные планы 👇
испечь блинов,
разобрать свежие исследования по ИИ.
Может ли LLM с 1 миллиардом параметров обойти LLM c 405 миллиардами?
Всем привет, сегодня хотел обсудить статью с многообещающим названием "Can 1B LLM Surpass 405B LLM?".
забегая вперед, ответ - да (можно увидеть на картинке 1), конечно, с оговоркой, что на некоторых задачах и при определенных условиях
что за задачи и условия? об этом и поговорим; задач в статье рассмотрено две, точнее два набора задач - MATH-500 и AIME24
MATH-500 - это 500 математических задач уровня старшей школы, которые предназначены для решения школьниками в классе, AIME24 - это 24 олимпиадных задачи также уровня старшей школы; в последнее время эти два набора стали популярны для оценки моделей по математике
выбор из нескольких параллельно сгенерированных вариантов (Best of N, BoN), построения дерева рассуждений (Beam Search) и выбор из нескольких таких деревьев (Diverse Verifier Tree Search, DVTS), они все показаны на картинке 2; у каждого из этих вариантов есть свои гиперпараметры, например, количество вариантов для BoN или деревьев для DVTS
на этой оптимистической ноте я бы хотел закончить свой рассказ; в комментариях накидывайте варианты статей для будущих разборов 🔚Читать полностью…
📹 Уже в эфире! Разбираем дипфейки на реальных примерах.
Подключайтесь по ссылке :) За лучший вопрос в чате — плед от команды MTS AI 🎁
#MTSAI_events
🧬 Будущее науки в руках ИИ?
Google представил AI co-scientist — ИИ-агента на базе Gemini 2.0, который помогает ученым анализировать огромные массивы данных, генерировать гипотезы и ускорять научные открытия.
Помощник уже предложил новые способы лечения фиброза печени и нашёл альтернативное применение существующим лекарствам от лейкемии.
Конфликт юрисдикций в эпоху ИИ. В Индии набирает обороты судебный спор против OpenAI.
В конце 2024 года индийское новостное агентство ANI подало иск против OpenAI, обвинив компанию в незаконном использовании авторского контента при обучении ИИ-моделей. Истцы требуют удалить их материалы из уже обученной модели и выплатить компенсацию в $230 000. К иску уже присоединились Ассоциация издателей цифровых новостей (DNPA), Indian Express и Hindustan Times.
Позиция СМИ:
– OpenAI использует защищённый авторским правом контент без разрешения.
- Компания не имеет лицензионных соглашений с индийскими СМИ, в отличие от некоторых международных партнёров.
– Действия OpenAI угрожают авторским правам издателей и наносят ущерб их бизнесу, усиливая доминирование технологических корпораций в распределении контента и рекламных доходов.
Позиция OpenAI:
– Удаление данных технически почти невозможно. Даже если компания исключит определённые тексты из будущих версий, предыдущие релизы останутся «загрязнёнными».
– Запрос истцов противоречит законодательству США, включая принципы добросовестного использования (fair use) и условия хранения информации, предусмотренные Digital Millennium Copyright Act (DMCA).
Текущий статус:
Высокий суд Дели рассматривает вопрос о юрисдикции. OpenAI утверждает, что индийские суды не могут рассматривать иск, поскольку серверы и обучение моделей находятся за пределами Индии. Однако суд назначил слушания на февраль 2025 года, чтобы оценить аргументы о доступности ChatGPT в Индии и применимости местного законодательства.
Попросили прокомментировать старшего юриста MTS AI Кирилла Дьякова:
Как может разрешиться спор?
Индия применяет смешанную систему права, поэтому судья, вероятно, опираясь на прецедент с Telegram (2022), признает юрисдикцию местных судов, несмотря на иностранные серверы OpenAI. Это вынудит компанию либо договариваться с истцами, либо искать технические решения для удаления данных.
Что ждёт ИИ-индустрию?
1. Каждая страна, защищая свой «юридический суверенитет», будет вводить новые регуляторные нормы, опираясь на судебную практику и мировой опыт.
2. Разработчикам ИИ придётся:
– Вести реестры данных, используемых для обучения моделей.
– Заключать лицензионные соглашения с правообладателями.
– Разрабатывать методы «забывания» данных (machine unlearning), что станет критически важным.
⚪ Коллеги, есть разговор
Мы решили, что об ИИ никто не расскажет лучше, чем человек, который разбирается в теме и двигает науку вперед. Поэтому провели тщательный отбор и выбрали идеального кандидата в авторы (имя пока держим в секрете 🙊).
Вот что нам о нем известно:
🔴 Руководит исследованиями в области NLP
🔴 Преподает в топовых вузах и готовит будущих ИИ-специалистов
🔴Автор 100+ научных работ, опубликованных на ведущих AI-конференциях
🔴 Входит в Научный совет Альянса в сфере искусственного интеллекта
Выбираем, какую исследовательскую статью он разберет в следующую среду ⤵
🔗 1
🔗 2
🔗 3
Можно ли научить ИИ рассуждать, как программист?
🧑💻DeepSeek представила CodeI/O — метод, который помогает языковым моделям (LLM) осваивать логику программирования и развивать навыки рассуждений, анализируя код.
🔬 Для обучения исследователи собрали 810 000 примеров кода на Python, включая задачи по математике, логике и алгоритмам. Затем код трансформировали в формат ввода-вывода, протестировали с помощью DeepSeek-V2.5 и добавили пошаговые объяснения по методу Chain-of-Thought.
📊 Улучшенная версия CodeI/O++ показала, что ИИ может самостоятельно разбираться в сложных задачах благодаря механизму обратной связи (если ответ неверный, модель получает объяснение ошибки и пробует снова).
GitHub | Исследование
Meta* научилась предсказывать текст по сигналам мозга
Компания представила Brain2Qwerty — ИИ, который расшифровывает мысли без имплантов и операций. Подробнее о том, как он работает и какие результаты показывает, читайте на карточках →
Спойлер: средняя ошибка Brain2Qwerty составила 67% (на EGG), а у отдельной категории участников эксперимента — 19%.
Как оцениваете технологию?
*признана экстремистской организацией и запрещена в РФЧитать полностью…
Цифровые двойники повсюду
Их жертвами становятся не только бабушки и дедушки в России, но и даже итальянская элита, включая президента Prada Патрицио Бертелли, модельера Джорджио Армани и миллиардера Массимо Моратти.
Как распознать поддельный голос и не попасться на удочку мошенников? Расскажем 25 февраля в 11:00 на вебинаре MTS AI.
А также разберем:
🔴 как работают технологии создания и распознавания поддельных голосов;
🔴 как AI обучается выявлять дипфейки;
🔴 как на практике защититься от мошенников.
🎓 С Днем российской науки!
Да, официально праздник — 8 февраля, но мы не можем уйти на выходные, не поделившись важной мыслью: в науке решает не количество публикаций, а живой обмен знаниями, участие в конференциях и дискуссиях. Особенно в области AI.
Дарья Галимзянова, NLP-разработчик в MTS AI, написала на Хабре подробный гид, как попасть на научную конференцию со своей статьей. Как выбрать подходящее событие? Когда начинать готовиться? Почему вашу статью могут не принять? Миллион нюансов — и все с пошаговым разбором.
📖 Читайте и ставьте ❤️ , если узнали кадр из фильма.
🔥 Этот год для ИИ-агентов обещает быть жарким
OpenAI представила Deep Research — ИИ-агента, который автономно проводит исследования и решает сложные задачи.
Что важно знать:
🔴 Работает на "рассуждающей" модели o3.
🔴 Сочетает в себе возможности веб-браузинга, анализирует, прикрепленные файлы и выполняет Python-скриптов.
🔴 В основе лежит принцип автономного планирования исследования — уточняет вопросы, отбирает источники.
🔴 Обрабатывает сотни текстов, изображений и PDF-документов.
🔴 Генерирует подробный отчет за 10–30 минут.
🔴 В тесте Humanity’s Last Exam набирает 26,6% — в 12 раз лучше Grok-2 и GPT-4o.
🔴Доступен для пользователей ChatGPT Pro.
Ваше мнение:
Deep Research — это
🔥 — шаг на пути к AGI
⚡️ — очередная надстройка для LLM