mashkka_ds | Unsorted

Telegram-канал mashkka_ds - Mashkka про Data Science

4308

Погружение в Data Science и технологии GenAI

Subscribe to a channel

Mashkka про Data Science

🍂#justaboutme ловлю Подмосквоный осенний vibe

Немного утреннего backstage с моей сентябрьской вылазки в СберУнивер. Продолжаю практиковать свои навыки скандинавской ходьбы.

#justaboutme - воскресная рубрика, в которой я делюсь яркими событиями из своей жизни, не связанными с DS и ИТ подобно тому, как я это делаю в соцсетях.

Читать полностью…

Mashkka про Data Science

😈Увидимся на AIJ Deep Dive 19-20 ноября

AIJ - ежегодное путешествие в мир искусственного интеллекта, ставшее отличной традицией. В этом году вас ждет специальный очный трек для тех, кто не просто следит за трендами в сфере AI, а создаёт их сам!

Тематические дни
🤩 НАУКА (19 ноября) — прорывные исследования, передовые R&D-разработки и глубокий технический разбор решений

🤩 БИЗНЕС (20 ноября) — реальные кейсы внедрения AI, практические результаты и оценка эффективности

Почему трек AIJ Deep Dive нельзя пропустить ⤵️
• Выступления топовых российских и зарубежных экспертов
• Нетворкинг и возможность лично задать вопросы спикерам
• Только реальные кейсы, инсайды и решения
• Постерная сессия научных статей, в том числе уровня А и А*
• Увидите изнутри, как рождаются прорывные технологии

❔Будет ли там ваш покорная слуга? Конечно!
❔О чем я буду рассказывать? Следите за новостями и узнаете!

🖥 Регистрируйтесь уже сейчас и забивайте дату в календаре!

@mashkka_ds
#llm #ai

Читать полностью…

Mashkka про Data Science

👀State of AI Report 2025 уже в продаже

Вышел State of AI Report за 25 год.

Ключевые выводы:

✔️OpenAI сохраняет лидерство, но Китай с моделями DeepSeek, Qwen и Kimi стремительно сокращает разрыв, укрепляя позицию второй державы в ИИ.

✔️Год стал прорывным в области reasoning: модели научились планировать, рефлексировать и самокорректироваться на длинных временных горизонтах.

✔️ИИ превращается в научного соавтора — системы вроде DeepMind Co-Scientist и Stanford Virtual Lab уже генерируют и проверяют гипотезы.

✔️Воплощённые ИИ-системы вроде Molmo-Act и Gemini Robotics 1.5 начали применять пошаговое рассуждение (Chain-of-Action) перед действием.

✔️Внедрение ИИ в бизнес ускорилось: 44% компаний США используют ИИ-инструменты, а средний контракт достиг $530 000.

✔️95% специалистов применяют ИИ дома или на работе, что подтверждает массовое распространение технологий.

✔️Началась индустриальная эра ИИ: гига-дата-центры вроде Stargate становятся новой инфраструктурой, а энергия — ключевым ресурсом.

✔️Политизация усилилась: США делают ставку на национальные интересы, Европа буксует с AI Act, Китай развивает открытые модели и производство чипов.

✔️Исследования безопасности становятся практичнее — модели имитируют выравненность, вызывая споры о прозрачности и контроле.

✔️Дискуссия о рисках сместилась к вопросам надёжности, киберустойчивости и управляемости автономных систем.

#aireport

Читать полностью…

Mashkka про Data Science

🐈 Если ты ждал знак, чтобы рассказать, как круто знаешь или используешь технологии искусственного интеллекта — вот он!

Приём заявок на Всероссийскую премию за применение и популяризацию технологий ИИ RuCode продлён до 20 октября.

3 миллиона призового фонда уже ждут 💲

А также:
🟣поддержка лауреатов и их проектов в СМИ и социальных сетях
🟣встреча с представителями ведущих вузов России
🟣возможность поработать с экспертами крупных ИТ-компаний
🟣привлечение потенциальных инвесторов
🟣индивидуальный план вашего проекта

11 номинаций найдут своих лауреатов 💎

Подать заявку могут граждане России, а также коммерческие и некоммерческие организации, которые занимаются применением и популяризацией технологий искусственного интеллекта.

Ждём:
🟣образовательные и научные организации
🟣преподавателей школ, СПО и вузов
🟣школьников и студентов
🟣разработчиков и исследователей
🟣ИТ-специалистов
🟣популяризаторов науки и блогеров

Премия проводится в рамках Всероссийского ИТ-Фестиваля RuCode, который проходит при поддержке Минобрнауки. Партнёры Премии RuCode — компания MWS (генеральный партнёр), Группа Астра, Сбер и Киберпротект (в двух номинациях).

Подать заявку можно на сайте до 20 октября ⚡️

Читать полностью…

Mashkka про Data Science

🪩#justaboutme Disney Princess Gone Wild

Когда я задумала отметить день рождения в Москве и придумала тему Disney, я про себя решила, что надену что угодно, только не в очередной раз розовый цвет...

...но что-то пошло не так, Disney Princess видимо Gone Wild, а я воплощаюсь в тотальный Барби-лук. Ну а друзья, конечно, не могли меня в этом не поддержать!


#justaboutme - воскресная рубрика, в которой я делюсь яркими событиями из своей жизни, не связанными с DS и ИТ подобно тому, как я это делаю в соцсетях.

Читать полностью…

Mashkka про Data Science

Увидела у @rybolos_channel и математик во мне валялся в икоте пАд сталом
#пятничныемемасы

Читать полностью…

Mashkka про Data Science

Всем привет!

Горячий сезон конференций продолжается, а это всегда отличная возможность «на людей посмотреть и себя показать» 🗣️

Из ближайших событий — GigaChat Audio Day 🔊. Митап про будущее речевых технологий, который пройдет 3 октября в Нижнем Новгороде.

👉🏻 Что в программе?
Живые истории о том, как исследования становятся работающими сервисами:
— production ASR на минимальных данных
— Speaker Diarization: распознавание голосов в реальном времени
— быстрые команды для колонок без перегрузки ресурсов
— суммаризация трёхчасовых видео в GigaChat

После докладов — время для нетворкинга: возможность обсудить идеи и обменяться опытом с экспертами и коллегами из индустрии.

👉🏻 Кому будет интересно?
Специалистам уровня middle+ / senior в области ML, NLP и Speech, а также для data-аналитикам, которые работают с большими массивами данных, качеством разметки и метриками моделей.

📍Онлайн и офлайн
Полная программа и регистрация на событие на сайте конференции.

#conference

Читать полностью…

Mashkka про Data Science

🏰#justaboutme в замках Франции жить свою лучшую жизнь

Неделю я жила в старинных замках на севере Франции и путешествовала по невероятно красивым местам. С'est la France! C'est joli!

А еще случайно попала в Сорбонну. И теперь думаю, делать ли здесь про это отдельный пост? Проголосуйте ниже в опросе⬇️

#justaboutme - воскресная рубрика, в которой я делюсь яркими событиями из своей жизни, не связанными с DS и ИТ подобно тому, как я это делаю в соцсетях.

#mashkka_france

Читать полностью…

Mashkka про Data Science

#пятничныемемасы
Звонить без предупреждения имеют право только потерявшиеся курьеры😂

Читать полностью…

Mashkka про Data Science

Мы начали! Ты с нами?

Читать полностью…

Mashkka про Data Science

🏰#justaboutme в замках Франции жить свою лучшую жизнь

На день рождения сделала себе королевский подарок и вместе с @kultamaria отправилась в незабываемый тур: ворвалась в свои 31 в знаменитом кабаре Moulin Rouge, а потом устроила с подругами пир из свежайших устриц прямо на морском берегу. А дальше...

...дальше мы неделю провели в настоящих старинных французских замках (вы знали, что в некоторых из них и правда можно пожить, забронировав его на денек?), открывая для себя Нормандию и Бретань.

Незабываемых впечатлений столько, что хватит ни на один раз. А я в очередной раз убедилась, что мечты можно и нужно осуществлять. Главное не стесняться мечтать и целустремленно идти вперед! И вам желаю того же! Дерзайте и осуществляйте самые смелые и самые заветные мечты!

#justaboutme - воскресная рубрика, в которой я делюсь яркими событиями из своей жизни, не связанными с DS и ИТ подобно тому, как я это делаю в соцсетях.

#mashkka_france

Читать полностью…

Mashkka про Data Science

Принцесса на каникулах✨

Я не пропала, а на неделю ушла в отпуск, чтобы в древних французских замках жить свою лучшую жизнь, вдохновляться красотой Нормандии и Бретани и каждый день, открывая глаза, видеть новое место и новый старинный замок за окном.

Про замки, день рождения в Moulin Rouge и праздничный обед из устриц расскажу в традиционной воскресной рубрике, а пока вас напоминаю, как важно идти в направлении своей мечты! Dream Big и все получится! Зачастую, это не так невозможно как кажется на первый взгляд!

#mashkka_france

Читать полностью…

Mashkka про Data Science

Приглашаем на следующий #AIRI_Seminars, который пройдет 24 сентября в 17:00 ⤵️

⚫️Тема: «Мультимодальные модели с рассуждениями: принципы, конструирование данных и валидация результатов».

⚫️Докладчик: Елизавета Гончарова, кандидат компьютерных наук, руководитель группы «Мультимодальный ИИ» Лаборатории Fusion Brain AIRI.

⚫️Оппонент: Владимир Иванов, руководитель Лаборатории методов обработки естественного языка в программной инженерии, доцент Университета Иннополис.

Подробное описание и регистрация на офлайн-формат на сайте.

YouTube | VK Видео

Читать полностью…

Mashkka про Data Science

#пятничныемемасы
Мне нравится этот тренд! Поддержим?

Читать полностью…

Mashkka про Data Science

🐾По следам вебинара Методы ансаблирования, которые должен знать любой Data Scientist

На открытом уроке от OTUS рассказываю про самые популярные методы ансамблирования классического ML. Сразу отвечаю на ваш вопрос - градиентный бустинг будет, а еще будут бэггинг и Random Forest. Все алгоритмы посмотрим как в теории, так и на практике.

@mashkka_ds

👀Запись
📖
Презентация
💻Практика
#ml #последамвебинара

Читать полностью…

Mashkka про Data Science

Я зарегистрировалась, ваш ход ;)

Читать полностью…

Mashkka про Data Science

Я была на пределе, пришлось идти на крайние меры😂
#пятничныемемасы

Читать полностью…

Mashkka про Data Science

От жестов к фразам! 🎉 На нашем сайте — новый раздел!

Всем привет! Наша команда не стоит на месте, мы запустили то, о чем многие нас спрашивали — раздел с готовыми фразами и предложениями на РЖЯ! 🚀

Раньше наш словарь помогал учить отдельные жесты-слова. В новом разделе вы найдёте, как слова складываются в живые фразы и предложения.

Почему это круто?

1️⃣ Становится понятна настоящая грамматика и лексика РЖЯ.
2️⃣ Можно увидеть, как работает немануальный компонент (мимика и движения губ).
3️⃣ Учиться говорить целыми фразами стало гораздо проще!

Заглядывайте, изучайте и делитесь с друзьями, кто интересуется РЖЯ 👇
➡️ [https://signflow.ru/phrases]

Благодарим АНО ДПО «Центр образования и исследования жестового языка», а также команду Спецпроектов RnD за вклад в развитие сайта.
Ждём ваши отзывы! Пишите в комментариях названия тем, которые вы хотели бы изучить! ❤️

#РЖЯ #release

Читать полностью…

Mashkka про Data Science

Визуализация, которой пользуются: правила для составления дашбордов

Красивый дашборд, все кивают, а решение принимают интуитивно. Видели? Я видел десятки раз. Проблема не в данных, а в том, что экран не отвечает на управленческий вопрос.

Как это починить:

1️⃣ Сначала вопрос, потом график. Что именно хотим решить: перераспределить бюджет, снять риск, ускорить воронку. Если вопроса нет, втыкание в дашборд в 90% случаев только ест время.

2️⃣ Один экран — один тезис. Если тезисов два, это два экрана. Концентрация конечна.

3️⃣ Единицы и масштабы без сюрпризов. Подписи в явных единицах, проценты форматированы, шкала с нуля, если это не разрушает смысл.

4️⃣ Сравнение обязательно. Вчера, план, соседний кластер. Без контекста цифра - это просто красивая цифра.

5️⃣ Действие в зависимости от данных. Внизу экрана if-else: если метрика падает - что делаем завтра, если растет - что усиливаем.

Практические проверки, которые реально помогают:

⚠️ Если смысл не считывается за 5 секунд, меняем визуал или выносим тезис в заголовок.

⚠️ Если по информации на экране нельзя принять решение, убираем декоративный шум и добавляем то, чего не хватает для принятия решения :)

⚠️ Если спорите о цифрах, а не о действиях, значит нет понятной операционализации метрики.

К сожалению, на совещаниях и комитетах, где уже нужно принять 5-10 решений за час-два, уже некогда копать. Если из вашего дашборда непонятно, что делать дальше, на этих встречах будут смотреть не на него, а на экспрессивность каждого оратора за столом и заботливо подготовленные и положенные на слайды графики, а значит решение станет еще дальше от реальных данных и появится лишний простор для манипуляций. Дашборды работают, когда вся организация использует как источник информации именно одни и те же дашборды, а не десяток различных картинок из десятка различных презентаций десятка заинтересованных лиц.

Читать полностью…

Mashkka про Data Science

🎇С Днём учителя!

Этот день не только про букеты и звонки на урок.
Сегодня отличный повод сказать спасибо всем, кто умеет объяснять сложноe простыми словами и делать мир чуть умнее.

Педагоги, преподаватели, наставники — вы настоящие маги знаний! ✨

Хороших учеников и удобного расписания уроков и пар!

🥳И с днем учителя меня [сам себя не поздравишь как говорится, никто...😜]

Читать полностью…

Mashkka про Data Science

🎬 Kandinsky 5.0 Video Lite — новая open source модель генерации видео 🎬

Мы выпускаем Kandinsky 5.0 Video Lite — первую модель новой линейки Kandinsky-5. Модель работает в разрешении 768×512 и при небольшом размере всего в 2B параметров демонстрирует качество, превосходящее предыдущие версии Kandinsky и большую часть актуальных открытых open source решений

Генерация видео до сих пор остаётся одной из самых сложных инженерных задач в Generative AI. Причём и как с точки зрения подготовки данных для обучения и распределённого обучения моделей, а затем масштабирования, так и с точки зрения инференса такого рода архитектур. Если картинки уже можно делать фотореалистичными даже на «бытовом» железе, то качественные видео в высоких разрешениях до сих пор можно сгенерировать только большими моделями, которые запускаются на топовых GPU

Мы решили это изменить и при разработке сделать ключевой акцент на эффективности: модель Lite компактна, требует меньше ресурсов и генерирует быстрее. Такой результат стал возможен благодаря комплексной работе — от сбора и подготовки данных до инженерных оптимизаций pre-train и сбора качественных данных для SFT. Мы исследовали современные методы оптимизации архитектур и применили собственные наработки для балансировки качества и скорости

⚡️В открытый доступ мы выкладываем следующие чекпоинты (для генерации 5 сек и 10 сек видео):
💡 SFT: максимальное качество (она же основная Kandinsky 5.0 Video Lite)
💡 CFG-distilled: x2 быстрее
💡 Diffusion-distilled: x6 быстрее при минимальной потере качества
💡 Pretrain: для исследований и дообучения

⚡️Некоторые технические детали:
💡Архитектура основана на Diffusion Transformer (DiT) с flow matching (подробнее см. Хабр)
💡Pre-train модели осуществлялся примерно на 520 млн изображений и 125 млн видео-сцен
💡Делали упор на Alignment (в частности, SFT) на качественных визуальных данных, предварительно отобранных большой командой профессиональных художников и дизайнеров. Этот этап дал самый большой прирост по визуальному качеству
💡Для 10-секундной генерации используется разработанный нами метод разреженного внимания NABLA

⚡️По внутренним замерам SFT версия (5 сек) превосходит по общему качеству (которое включает в себя оценку качества следования промпту, визуала и динамики) гораздо более громоздкие модели, такие как Wan 2.1 14B, Wan 2.2 5B и оригинальную Sora, и сравнима по визуальному качеству с моделью Wan 2.2 A14B, которая больше Kandinsky в 13-14 раз. При этом генерации 10 сек версий также демонстрируют высокое качество и стабильность

⚡️Где и как можно потестить:
💡Моделями можно воспользоваться, записавшись в вайтлист бота (к сожалению, только для ограниченного количества пользователей)
💡Все материалы есть на HuggingFace, GitHub и GitVerse, также есть ComfyUI
💡Модели распространяются по открытой лицензии с поддержкой коммерческого использования

И ещё раз все полезные ссылки в одном месте:

👉 Хабр (технические подробности)
👉 Project Page (демо)
👉 Github (код)
👉 Hugging Face (чекпоинты)
👉 GitVerse (код)
👉 NABLA (paper)
👉 Бот для записи в вайтлист

Читать полностью…

Mashkka про Data Science

🎁Лучший подарок на мой день рождения🎁
🤖Личнопост, но тоже про AI.

Подарки на день рождения все еще находят меня, а этот превзошел просто все.

В подарках я так ценю личное внимание и участие. А моя подруга - @LeraValium, шикарная преподавательница итальянского, талантливый хореограф и просто невероятно креативный и творческий человек - сделала этот генеративный шедевр с моей биографией в стиле Disney Princess специально для меня!

Сказать, что я в восторге - не сказать ничего. Я [@LeraValium, подскажи, как будет на итальянском в полнейшем восторге от слова совсем?]. Спасибо тебе!

#genai

Читать полностью…

Mashkka про Data Science

🗣Digest полезных материалов по NLP
🌐Rotary Positional Embeddings (RoPE)
1️⃣Все про позиционное кодирование на HF
2️⃣parulsharmmaa/understanding-rotary-positional-embedding-and-implementation-9f4ad8b03e32">Статья на Medium про RoPE
3️⃣Хороший пост про RoPE
4️⃣Объяснение RoPE на YouTube

@mashkka_ds

#ml_на_пальцах #nlp_на_пальцах #полезныематериалы #usefullinks #nlp #llm #huggingface

Читать полностью…

Mashkka про Data Science

🐲DRAGON и POLLUX на AI R&D Day🐲

Выступили с коллегой на AI R&D Day с докладом Норм или стрем? Оценка генераций в динамическом RAG бенчмарке. Рассказали про наши новые проекты DRAGON для оценки RAG-систем и POLLUX для оценки генеративных способностей моделей.

👀Слайды
🧐
Подробности про DRAGON

@mashkka_ds
#llm #ai #ds

Читать полностью…

Mashkka про Data Science

🎤AI R&D Day уже завтра

В программе будет два больших трека: 🤖 CoreAI и 🖼 GenAI. И обязательно приходите на мой доклад в 17.00 Норм или стрем? Оценка генераций в динамическом RAG бенчмарке - вместе с коллегой расскажем про наши новые проекты POLLUX и DRAGON.

👉Регистрация: тут
🏘Место: Москва+онлайн
🕐Время: 24 сентября

Читать полностью…

Mashkka про Data Science

🎤А ты придешь на AI R&D Day?

Запишите дату 24го сентября в календарь и зарезервируйте ее на AI R&D Day, на котором я и мои коллеги расскажем про последние достижения и разработки в области ML и AI.

И обязательно приходите на мой доклад в 17.00 Норм или стрем? Оценка генераций в динамическом RAG бенчмарке - вместе с коллегой расскажем про наши новые проекты POLLUX и DRAGON.

👉Регистрация: тут
🏘Место: Москва+онлайн
🕐Время: 24 сентября

Читать полностью…

Mashkka про Data Science

#justaboutme В полночь происходит магия

В честь дня рождения перешла на черную сторону.

#justaboutme - воскресная рубрика, в которой я делюсь яркими событиями из своей жизни, не связанными с DS и ИТ подобно тому, как я это делаю в соцсетях.

#justaboutme

Читать полностью…

Mashkka про Data Science

🎂С днем рождения меня🎂

В честь дня рождения повторяю challenge. Смотрим до конца - там пасхалочка в честь др.

По традиции принимаю поздравления в комментариях, а если поздравите в сториз, тэгнув канал - буду счастлива до небес!

@mashkka_ds

#деньрождения

Читать полностью…

Mashkka про Data Science

🗣Digest полезных материалов по NLP
🌐Парсинг данных через Selenium

1️⃣Write your first Selenium script из документации Selenium
2️⃣Interacting with web elements - шпаргалка по основным элементам
3️⃣Real Python: Modern Web Automation with Python and Selenium - хороший современный тьюториал
4️⃣Selenium Automation on Google Colab - туториал по установке Chrome/драйвера в Colab.

👉Материалы по парсингу через requests.

@mashkka_ds

#ml_на_пальцах #полезныематериалы #usefullinks

Читать полностью…

Mashkka про Data Science

🎤Сергей Марков об ИИ

В новом интервью @oulenspiegel_channel расставляет все точки над ИИ и рассказывает про
принципы работы нейросетей, перспективы развития технологии ИИ, а также проблемы и преграды, стоящие на пути этого развития.

👀Смотрим

Читать полностью…
Subscribe to a channel