4308
Погружение в Data Science и технологии GenAI
🍂#justaboutme ловлю Подмосквоный осенний vibe
Немного утреннего backstage с моей сентябрьской вылазки в СберУнивер. Продолжаю практиковать свои навыки скандинавской ходьбы.
❕#justaboutme - воскресная рубрика, в которой я делюсь яркими событиями из своей жизни, не связанными с DS и ИТ подобно тому, как я это делаю в соцсетях.
😈Увидимся на AIJ Deep Dive 19-20 ноября
AIJ - ежегодное путешествие в мир искусственного интеллекта, ставшее отличной традицией. В этом году вас ждет специальный очный трек для тех, кто не просто следит за трендами в сфере AI, а создаёт их сам!
Тематические дни
🤩 НАУКА (19 ноября) — прорывные исследования, передовые R&D-разработки и глубокий технический разбор решений
🤩 БИЗНЕС (20 ноября) — реальные кейсы внедрения AI, практические результаты и оценка эффективности
Почему трек AIJ Deep Dive нельзя пропустить ⤵️
• Выступления топовых российских и зарубежных экспертов
• Нетворкинг и возможность лично задать вопросы спикерам
• Только реальные кейсы, инсайды и решения
• Постерная сессия научных статей, в том числе уровня А и А*
• Увидите изнутри, как рождаются прорывные технологии
❔Будет ли там ваш покорная слуга? Конечно!
❔О чем я буду рассказывать? Следите за новостями и узнаете!
🖥 Регистрируйтесь уже сейчас и забивайте дату в календаре!
@mashkka_ds
#llm #ai
👀State of AI Report 2025 уже в продаже
Вышел State of AI Report за 25 год.
Ключевые выводы:
✔️OpenAI сохраняет лидерство, но Китай с моделями DeepSeek, Qwen и Kimi стремительно сокращает разрыв, укрепляя позицию второй державы в ИИ.
✔️Год стал прорывным в области reasoning: модели научились планировать, рефлексировать и самокорректироваться на длинных временных горизонтах.
✔️ИИ превращается в научного соавтора — системы вроде DeepMind Co-Scientist и Stanford Virtual Lab уже генерируют и проверяют гипотезы.
✔️Воплощённые ИИ-системы вроде Molmo-Act и Gemini Robotics 1.5 начали применять пошаговое рассуждение (Chain-of-Action) перед действием.
✔️Внедрение ИИ в бизнес ускорилось: 44% компаний США используют ИИ-инструменты, а средний контракт достиг $530 000.
✔️95% специалистов применяют ИИ дома или на работе, что подтверждает массовое распространение технологий.
✔️Началась индустриальная эра ИИ: гига-дата-центры вроде Stargate становятся новой инфраструктурой, а энергия — ключевым ресурсом.
✔️Политизация усилилась: США делают ставку на национальные интересы, Европа буксует с AI Act, Китай развивает открытые модели и производство чипов.
✔️Исследования безопасности становятся практичнее — модели имитируют выравненность, вызывая споры о прозрачности и контроле.
✔️Дискуссия о рисках сместилась к вопросам надёжности, киберустойчивости и управляемости автономных систем.
#aireport
🐈 Если ты ждал знак, чтобы рассказать, как круто знаешь или используешь технологии искусственного интеллекта — вот он!
Приём заявок на Всероссийскую премию за применение и популяризацию технологий ИИ RuCode продлён до 20 октября.
3 миллиона призового фонда уже ждут 💲
А также:
🟣поддержка лауреатов и их проектов в СМИ и социальных сетях
🟣встреча с представителями ведущих вузов России
🟣возможность поработать с экспертами крупных ИТ-компаний
🟣привлечение потенциальных инвесторов
🟣индивидуальный план вашего проекта
11 номинаций найдут своих лауреатов 💎
Подать заявку могут граждане России, а также коммерческие и некоммерческие организации, которые занимаются применением и популяризацией технологий искусственного интеллекта.
Ждём:
🟣образовательные и научные организации
🟣преподавателей школ, СПО и вузов
🟣школьников и студентов
🟣разработчиков и исследователей
🟣ИТ-специалистов
🟣популяризаторов науки и блогеров
Премия проводится в рамках Всероссийского ИТ-Фестиваля RuCode, который проходит при поддержке Минобрнауки. Партнёры Премии RuCode — компания MWS (генеральный партнёр), Группа Астра, Сбер и Киберпротект (в двух номинациях).
Подать заявку можно на сайте до 20 октября ⚡️
🪩#justaboutme Disney Princess Gone Wild
⠀
Когда я задумала отметить день рождения в Москве и придумала тему Disney, я про себя решила, что надену что угодно, только не в очередной раз розовый цвет...
⠀
...но что-то пошло не так, Disney Princess видимо Gone Wild, а я воплощаюсь в тотальный Барби-лук. Ну а друзья, конечно, не могли меня в этом не поддержать!
⠀
❕#justaboutme - воскресная рубрика, в которой я делюсь яркими событиями из своей жизни, не связанными с DS и ИТ подобно тому, как я это делаю в соцсетях.
Увидела у @rybolos_channel и математик во мне валялся в икоте пАд сталом
#пятничныемемасы
Всем привет!
Горячий сезон конференций продолжается, а это всегда отличная возможность «на людей посмотреть и себя показать» 🗣️
Из ближайших событий — GigaChat Audio Day 🔊. Митап про будущее речевых технологий, который пройдет 3 октября в Нижнем Новгороде.
👉🏻 Что в программе?
Живые истории о том, как исследования становятся работающими сервисами:
— production ASR на минимальных данных
— Speaker Diarization: распознавание голосов в реальном времени
— быстрые команды для колонок без перегрузки ресурсов
— суммаризация трёхчасовых видео в GigaChat
После докладов — время для нетворкинга: возможность обсудить идеи и обменяться опытом с экспертами и коллегами из индустрии.
👉🏻 Кому будет интересно?
Специалистам уровня middle+ / senior в области ML, NLP и Speech, а также для data-аналитикам, которые работают с большими массивами данных, качеством разметки и метриками моделей.
📍Онлайн и офлайн
Полная программа и регистрация на событие на сайте конференции.
#conference
🏰#justaboutme в замках Франции жить свою лучшую жизнь
Неделю я жила в старинных замках на севере Франции и путешествовала по невероятно красивым местам. С'est la France! C'est joli!
А еще случайно попала в Сорбонну. И теперь думаю, делать ли здесь про это отдельный пост? Проголосуйте ниже в опросе⬇️
❕#justaboutme - воскресная рубрика, в которой я делюсь яркими событиями из своей жизни, не связанными с DS и ИТ подобно тому, как я это делаю в соцсетях.
#mashkka_france
#пятничныемемасы
Звонить без предупреждения имеют право только потерявшиеся курьеры😂
🏰#justaboutme в замках Франции жить свою лучшую жизнь
На день рождения сделала себе королевский подарок и вместе с @kultamaria отправилась в незабываемый тур: ворвалась в свои 31 в знаменитом кабаре Moulin Rouge, а потом устроила с подругами пир из свежайших устриц прямо на морском берегу. А дальше...
...дальше мы неделю провели в настоящих старинных французских замках (вы знали, что в некоторых из них и правда можно пожить, забронировав его на денек?), открывая для себя Нормандию и Бретань.
Незабываемых впечатлений столько, что хватит ни на один раз. А я в очередной раз убедилась, что мечты можно и нужно осуществлять. Главное не стесняться мечтать и целустремленно идти вперед! И вам желаю того же! Дерзайте и осуществляйте самые смелые и самые заветные мечты!
❕#justaboutme - воскресная рубрика, в которой я делюсь яркими событиями из своей жизни, не связанными с DS и ИТ подобно тому, как я это делаю в соцсетях.
#mashkka_france
✨Принцесса на каникулах✨
Я не пропала, а на неделю ушла в отпуск, чтобы в древних французских замках жить свою лучшую жизнь, вдохновляться красотой Нормандии и Бретани и каждый день, открывая глаза, видеть новое место и новый старинный замок за окном.
Про замки, день рождения в Moulin Rouge и праздничный обед из устриц расскажу в традиционной воскресной рубрике, а пока вас напоминаю, как важно идти в направлении своей мечты! Dream Big и все получится! Зачастую, это не так невозможно как кажется на первый взгляд!
#mashkka_france
Приглашаем на следующий #AIRI_Seminars, который пройдет 24 сентября в 17:00 ⤵️
⚫️Тема: «Мультимодальные модели с рассуждениями: принципы, конструирование данных и валидация результатов».
⚫️Докладчик: Елизавета Гончарова, кандидат компьютерных наук, руководитель группы «Мультимодальный ИИ» Лаборатории Fusion Brain AIRI.
⚫️Оппонент: Владимир Иванов, руководитель Лаборатории методов обработки естественного языка в программной инженерии, доцент Университета Иннополис.
Подробное описание и регистрация на офлайн-формат на сайте.
YouTube | VK Видео
#пятничныемемасы
Мне нравится этот тренд! Поддержим?
🐾По следам вебинара Методы ансаблирования, которые должен знать любой Data Scientist
На открытом уроке от OTUS рассказываю про самые популярные методы ансамблирования классического ML. Сразу отвечаю на ваш вопрос - градиентный бустинг будет, а еще будут бэггинг и Random Forest. Все алгоритмы посмотрим как в теории, так и на практике.
@mashkka_ds
👀Запись
📖Презентация
💻Практика
#ml #последамвебинара
Я была на пределе, пришлось идти на крайние меры😂
#пятничныемемасы
От жестов к фразам! 🎉 На нашем сайте — новый раздел!
Всем привет! Наша команда не стоит на месте, мы запустили то, о чем многие нас спрашивали — раздел с готовыми фразами и предложениями на РЖЯ! 🚀
Раньше наш словарь помогал учить отдельные жесты-слова. В новом разделе вы найдёте, как слова складываются в живые фразы и предложения.
Почему это круто?
1️⃣ Становится понятна настоящая грамматика и лексика РЖЯ.
2️⃣ Можно увидеть, как работает немануальный компонент (мимика и движения губ).
3️⃣ Учиться говорить целыми фразами стало гораздо проще!
Заглядывайте, изучайте и делитесь с друзьями, кто интересуется РЖЯ 👇
➡️ [https://signflow.ru/phrases]
Благодарим АНО ДПО «Центр образования и исследования жестового языка», а также команду Спецпроектов RnD за вклад в развитие сайта.
Ждём ваши отзывы! Пишите в комментариях названия тем, которые вы хотели бы изучить! ❤️
#РЖЯ #release
Визуализация, которой пользуются: правила для составления дашбордов
Красивый дашборд, все кивают, а решение принимают интуитивно. Видели? Я видел десятки раз. Проблема не в данных, а в том, что экран не отвечает на управленческий вопрос.
Как это починить:
1️⃣ Сначала вопрос, потом график. Что именно хотим решить: перераспределить бюджет, снять риск, ускорить воронку. Если вопроса нет, втыкание в дашборд в 90% случаев только ест время.
2️⃣ Один экран — один тезис. Если тезисов два, это два экрана. Концентрация конечна.
3️⃣ Единицы и масштабы без сюрпризов. Подписи в явных единицах, проценты форматированы, шкала с нуля, если это не разрушает смысл.
4️⃣ Сравнение обязательно. Вчера, план, соседний кластер. Без контекста цифра - это просто красивая цифра.
5️⃣ Действие в зависимости от данных. Внизу экрана if-else: если метрика падает - что делаем завтра, если растет - что усиливаем.
Практические проверки, которые реально помогают:
⚠️ Если смысл не считывается за 5 секунд, меняем визуал или выносим тезис в заголовок.
⚠️ Если по информации на экране нельзя принять решение, убираем декоративный шум и добавляем то, чего не хватает для принятия решения :)
⚠️ Если спорите о цифрах, а не о действиях, значит нет понятной операционализации метрики.
К сожалению, на совещаниях и комитетах, где уже нужно принять 5-10 решений за час-два, уже некогда копать. Если из вашего дашборда непонятно, что делать дальше, на этих встречах будут смотреть не на него, а на экспрессивность каждого оратора за столом и заботливо подготовленные и положенные на слайды графики, а значит решение станет еще дальше от реальных данных и появится лишний простор для манипуляций. Дашборды работают, когда вся организация использует как источник информации именно одни и те же дашборды, а не десяток различных картинок из десятка различных презентаций десятка заинтересованных лиц.
🎇С Днём учителя!
Этот день не только про букеты и звонки на урок.
Сегодня отличный повод сказать спасибо всем, кто умеет объяснять сложноe простыми словами и делать мир чуть умнее.
Педагоги, преподаватели, наставники — вы настоящие маги знаний! ✨
Хороших учеников и удобного расписания уроков и пар!
🥳И с днем учителя меня [сам себя не поздравишь как говорится, никто...😜]
🎬 Kandinsky 5.0 Video Lite — новая open source модель генерации видео 🎬
Мы выпускаем Kandinsky 5.0 Video Lite — первую модель новой линейки Kandinsky-5. Модель работает в разрешении 768×512 и при небольшом размере всего в 2B параметров демонстрирует качество, превосходящее предыдущие версии Kandinsky и большую часть актуальных открытых open source решений
Генерация видео до сих пор остаётся одной из самых сложных инженерных задач в Generative AI. Причём и как с точки зрения подготовки данных для обучения и распределённого обучения моделей, а затем масштабирования, так и с точки зрения инференса такого рода архитектур. Если картинки уже можно делать фотореалистичными даже на «бытовом» железе, то качественные видео в высоких разрешениях до сих пор можно сгенерировать только большими моделями, которые запускаются на топовых GPU
Мы решили это изменить и при разработке сделать ключевой акцент на эффективности: модель Lite компактна, требует меньше ресурсов и генерирует быстрее. Такой результат стал возможен благодаря комплексной работе — от сбора и подготовки данных до инженерных оптимизаций pre-train и сбора качественных данных для SFT. Мы исследовали современные методы оптимизации архитектур и применили собственные наработки для балансировки качества и скорости
⚡️В открытый доступ мы выкладываем следующие чекпоинты (для генерации 5 сек и 10 сек видео):
💡 SFT: максимальное качество (она же основная Kandinsky 5.0 Video Lite)
💡 CFG-distilled: x2 быстрее
💡 Diffusion-distilled: x6 быстрее при минимальной потере качества
💡 Pretrain: для исследований и дообучения
⚡️Некоторые технические детали:
💡Архитектура основана на Diffusion Transformer (DiT) с flow matching (подробнее см. Хабр)
💡Pre-train модели осуществлялся примерно на 520 млн изображений и 125 млн видео-сцен
💡Делали упор на Alignment (в частности, SFT) на качественных визуальных данных, предварительно отобранных большой командой профессиональных художников и дизайнеров. Этот этап дал самый большой прирост по визуальному качеству
💡Для 10-секундной генерации используется разработанный нами метод разреженного внимания NABLA
⚡️По внутренним замерам SFT версия (5 сек) превосходит по общему качеству (которое включает в себя оценку качества следования промпту, визуала и динамики) гораздо более громоздкие модели, такие как Wan 2.1 14B, Wan 2.2 5B и оригинальную Sora, и сравнима по визуальному качеству с моделью Wan 2.2 A14B, которая больше Kandinsky в 13-14 раз. При этом генерации 10 сек версий также демонстрируют высокое качество и стабильность
⚡️Где и как можно потестить:
💡Моделями можно воспользоваться, записавшись в вайтлист бота (к сожалению, только для ограниченного количества пользователей)
💡Все материалы есть на HuggingFace, GitHub и GitVerse, также есть ComfyUI
💡Модели распространяются по открытой лицензии с поддержкой коммерческого использования
И ещё раз все полезные ссылки в одном месте:
👉 Хабр (технические подробности)
👉 Project Page (демо)
👉 Github (код)
👉 Hugging Face (чекпоинты)
👉 GitVerse (код)
👉 NABLA (paper)
👉 Бот для записи в вайтлист
🎁Лучший подарок на мой день рождения🎁
🤖Личнопост, но тоже про AI.
Подарки на день рождения все еще находят меня, а этот превзошел просто все.
В подарках я так ценю личное внимание и участие. А моя подруга - @LeraValium, шикарная преподавательница итальянского, талантливый хореограф и просто невероятно креативный и творческий человек - сделала этот генеративный шедевр с моей биографией в стиле Disney Princess специально для меня!
Сказать, что я в восторге - не сказать ничего. Я [@LeraValium, подскажи, как будет на итальянском в полнейшем восторге от слова совсем?]. Спасибо тебе!
#genai
🗣Digest полезных материалов по NLP
🌐Rotary Positional Embeddings (RoPE)
1️⃣Все про позиционное кодирование на HF
2️⃣parulsharmmaa/understanding-rotary-positional-embedding-and-implementation-9f4ad8b03e32">Статья на Medium про RoPE
3️⃣Хороший пост про RoPE
4️⃣Объяснение RoPE на YouTube
@mashkka_ds
#ml_на_пальцах #nlp_на_пальцах #полезныематериалы #usefullinks #nlp #llm #huggingface
🐲DRAGON и POLLUX на AI R&D Day🐲
Выступили с коллегой на AI R&D Day с докладом Норм или стрем? Оценка генераций в динамическом RAG бенчмарке. Рассказали про наши новые проекты DRAGON для оценки RAG-систем и POLLUX для оценки генеративных способностей моделей.
👀Слайды
🧐Подробности про DRAGON
@mashkka_ds
#llm #ai #ds
🎤AI R&D Day уже завтра
В программе будет два больших трека: 🤖 CoreAI и 🖼 GenAI. И обязательно приходите на мой доклад в 17.00 Норм или стрем? Оценка генераций в динамическом RAG бенчмарке - вместе с коллегой расскажем про наши новые проекты POLLUX и DRAGON.
👉Регистрация: тут
🏘Место: Москва+онлайн
🕐Время: 24 сентября
🎤А ты придешь на AI R&D Day?
Запишите дату 24го сентября в календарь и зарезервируйте ее на AI R&D Day, на котором я и мои коллеги расскажем про последние достижения и разработки в области ML и AI.
И обязательно приходите на мой доклад в 17.00 Норм или стрем? Оценка генераций в динамическом RAG бенчмарке - вместе с коллегой расскажем про наши новые проекты POLLUX и DRAGON.
👉Регистрация: тут
🏘Место: Москва+онлайн
🕐Время: 24 сентября
#justaboutme В полночь происходит магия
В честь дня рождения перешла на черную сторону.
❕#justaboutme - воскресная рубрика, в которой я делюсь яркими событиями из своей жизни, не связанными с DS и ИТ подобно тому, как я это делаю в соцсетях.
#justaboutme
🎂С днем рождения меня🎂
В честь дня рождения повторяю challenge. Смотрим до конца - там пасхалочка в честь др.
По традиции принимаю поздравления в комментариях, а если поздравите в сториз, тэгнув канал - буду счастлива до небес!
@mashkka_ds
#деньрождения
🗣Digest полезных материалов по NLP
🌐Парсинг данных через Selenium
1️⃣Write your first Selenium script из документации Selenium
2️⃣Interacting with web elements - шпаргалка по основным элементам
3️⃣Real Python: Modern Web Automation with Python and Selenium - хороший современный тьюториал
4️⃣Selenium Automation on Google Colab - туториал по установке Chrome/драйвера в Colab.
👉Материалы по парсингу через requests.
@mashkka_ds
#ml_на_пальцах #полезныематериалы #usefullinks
🎤Сергей Марков об ИИ
В новом интервью @oulenspiegel_channel расставляет все точки над ИИ и рассказывает про
принципы работы нейросетей, перспективы развития технологии ИИ, а также проблемы и преграды, стоящие на пути этого развития.
👀Смотрим