data_analysis_ml | Unsorted

Telegram-канал data_analysis_ml - Анализ данных (Data analysis)

10807

Аналитика данных админ - @haarrp @ai_machinelearning_big_data - Machine learning @itchannels_telegram - 🔥лучшие ит-каналы @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚

Subscribe to a channel

Анализ данных (Data analysis)

Приглашаем в Гостиную к Алисе!

«Гостиная Алисы. Не один дома» — это митап от команды Яндекса для middle+ бэкендеров: доклады о том, как устроена Алиса, Умные устройства, Беспилотные технологии и нетворкинг в неформальной обстановка

🔸 Павел Капля, руководитель продуктовой разработки Алисы. Расскажет, как запускали Новые возможности — и что пришлось изменить в нашем помощнике, чтобы заставить её думать по новому

🔸 Марат Мавлютов, руководитель службы разработки роботов-доставщиков. Объяснит, как наши роботы-доставщики видят мир вокруг себя, строят маршрут, ориентируются в толпе и проезжают светофоры
18 апреля, 19:00
Москва
Зарегистрироваться можно здесь.

Реклама ООО "Яндекс"
ИНН 7736207543

Читать полностью…

Анализ данных (Data analysis)

С 15 по 21 апреля состоится мегаинтенсив по анализу данных, организованный Центром непрерывного образования, онлайн- и офлайн-магистратурами ФКН.

В программе интенсива 3 трека, разделенные по уровням сложности:

🖇Для начинающих: За 4 занятия вы сможете пройти путь от основ программирования на Python до построения настоящей модели машинного обучения. Организаторы — Центр непрерывного образования ФКН и онлайн-магистратура "Master of Data Science".

🖇Для продолжающих: Вы познакомитесь с архитектурами нейронных сетей в задачах компьютерного зрения, а также диффузионными моделями и моделью Stable Diffusion. Организатор — онлайн-магистратура «Машинное обучение и высоконагруженные системы».

🖇Многогранный Data Science: Для тех, кто хочет применять анализ данных не в IT — вы узнаете, как Data Science применяется в биологии, медицине, при строительстве домов и в банках. Организаторы — магистратуры «Анализ данных в биологии и медицине», «Анализ данных в девелопменте», «Финансовые технологии и анализ данных».

Интенсив пройдет в онлайн-формате с возможностью принять участие сразу в нескольких треках.

Участие бесплатное для всех желающих, нужно только зарегистрироваться: по ссылке.

Реклама. НИУ ВШЭ.
ИНН 7714030726
Erid: 2SDnjc1Wry7

Читать полностью…

Анализ данных (Data analysis)

🚀 Участвуй в True Tech Hack от МТС и поборись за общий призовой фонд в 1 500 000 рублей. Регистрируйся.

Приглашаем разработчиков, специалистов по Data Science, менеджеров по продукту, дизайнеров. Соревноваться предстоит в одном из двух треков, чтобы улучшить жизнь людей с особыми потребностями.

🏠 Трек 1. Улучшение клиентского опыта витрины МТС Live для пользователей с особыми потребностями
⭐ Трек 2. Разработка голосового управления для МТС Финтех на основе искусственного интеллекта для людей с ограниченными возможностями

Как пройдет True Tech Hack:
🔸 26 апреля – открытие хакатона и Q&A-сессия
🔸 27 апреля-12 мая – чек-поинты с экспертами
🔸 12 мая – окончание приема проектов
🔸 14 мая – полуфинал, защита лучших решений и объявление финалистов
🔸 17 мая – финал в Москве

True Tech Hack – твой шанс получить новый опыт, выиграть приз и сделать наш мир доступней и удобней для всех. Регистрируйся на хакатон до 25 апреля по ссылке.

Читать полностью…

Анализ данных (Data analysis)

Нейросеть для генерации изображений YandexART стала доступна для тестирования внешним компаниям!

В режиме закрытого превью нейросеть уже попробовали несколько внешних компаний. Например, крупная e-com сеть тестирует YandexART для создания уникального дизайна подарочных карт. Клиенты сети смогут ввести текстовый запрос и самостоятельно выбрать собственное оформление для карты.

Теперь на облачной платформе Yandex Cloud с помощью YandexART компании смогут создавать визуалы для рекламы и социальных сетей, дизайн-макеты, иллюстрации для диджитала и книг. Нейросеть можно встроить через API в различные сервисы и веб-приложения

Читать полностью…

Анализ данных (Data analysis)

⚡️ LLMWare — open-souce проект для разработки LLM-инструментов корпоративного уровня

Для чего LLMWare?
Позволяет создавать llmware slims — это небольшие специализированные модели, которые оптимизированы для использования с процессорами и позволяют автоматизировать задачи без дорогостоящего оборудования.

llmware slims могут выполнять различные задачи, такие как обобщение текста, извлечение тегов, определение тем, анализ намерений, классификация контента и распознавание именованных объектов.

Эти llmware slims легко настраиваются с помощью языка Python и веб-фреймворка Streamlit для создания удобного интерфейса

Вообще, вариантов использования масса, с чем можно ознакомиться в GitHub

🖥 GitHub
📎 Обзор

@ai_machinelearning_big_data

Читать полностью…

Анализ данных (Data analysis)

🔜 Парадоксы в данных, и почему визуализация бывает необходима

В этой статье несколько «парадоксов» в данных, о которых полезно знать как начинающему аналитику данных, так и любому человеку, кто не хочет быть введенным в заблуждение некорректными статистическими выводами.

За рассматриваемыми примерами не кроется сложной математики помимо базовых свойств выборки (таких, как среднее арифметическое и дисперсия), зато такие кейсы могут встретиться и на собеседовании в сфере Data Science, и в жизни.

📎 Статья

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

📌Модель машинного обучения Ferret-UI от Apple

Apple представила модель машинного обучения Ferret-UI для распознавания элементов пользовательского интерфейса. В исследовании компания отметила, что практически все доступные мультимодальные языковые модели плохо работают с интерфейсами. Нейросети не отличают кнопки от полей ввода и других элементов.

Компания собрала большой датасет для обучения Ferret-UI, что значительно улучшило распознавание. Отмечается, что нейросеть превосходит не только открытые MLLM, но и GPT-4. Модель можно использовать для реализации новых функций доступности. К примеру, нейросеть сможет управлять мобильным устройством, опираясь на запросы пользователя.

📎Инженеры компании опубликовали исследование на портале Arxiv.

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

Вы тоже сможете вырасти до хардового аналитика уровня Middle+. Как?
Добавьте к своим скилам навыки в проектировании архитектуры и интеграций веб-сервисов!

Шесть месяцев назад мы уже писали про этот курс. Сейчас пишем еще раз, потому что у курса вышло полезное обновление, уже доступное ученикам, независимо от того, когда они его купили.
—————
📚 Первое: в портфолио включили примеры интеграций от крупных BigTech-компаний. Это позволит вам понять, как технологии применяются в реальных бизнес-контекстах.
🌐 Второе: обновили портфолио. Теперь в нём есть задания повышенного уровня сложности для каждой темы. Это небольшие реальные проекты, с помощью которых можно не только проверить, но и улучшить свои навыки!
✔️Третье: вышел новый модуль про проектирование баз данных - нормализация, транзакции, основы DWH, индексы.
—————
• Результат после прохождения курса: 15 рабочих проектов в портфолио-резюме
• Доступ к урокам и всем обновлениям останется навсегда
• Фундаментальная база
• Всю программу и отзывы смотрите в боте курса

Когда перейдете в бот курса, то получите бесплатные открытые уроки по архитектуре и интеграциям. Польза 👇

/channel/studyit_help_bot?start=mldata

Скидка на курс от канала
— 1 000₽ на Stepik по промокоду
MLDATA до 30 апреля.

Читать полностью…

Анализ данных (Data analysis)

Хочешь присоединиться к команде, которая создаёт будущее автономного транспорта?

OneDayOffer — не просто мероприятие, это — шанс быстро вступить на новый этап карьеры. Мы предлагаем короткий путь к офферу от компании, создающей технологию автономного вождения.

Давай встретимся онлайн, пообщайся командой — получи шанс на предложение о работе. Мы ищем системных аналитиков и разработчиков на С++, готовых принять участие в уникальном проекте.

Просто оставь свои данные, выполни тестовое и жди приглашения на OneDayOffer 20 апреля. До встречи! Узнай больше по ссылке.

Читать полностью…

Анализ данных (Data analysis)

Yandex Cloud опубликовала программу сертификации по облачным технологиям.

Онлайн-тестирование пригодится инженерам, разработчикам, аналитикам, администраторам, архитекторам, DevOps и другим специалистам, которые хотят официально подтвердить свои знания.

Экзамен проверяет компетенции в шести областях: базовые облачные технологии, хранение и обработка данных, DevOps и автоматизация, бессерверные вычисления, информационная безопасность и биллинг.

Чтобы получить сертификат, нужно набрать минимум 35 баллов из 50. Если вышло меньше — через месяц можно будет попробовать снова.

Тестирование проходит с прокторингом на базе ИИ, который отслеживает попытки списать.

Первый тест состоится 11 апреля. Если хотите принять участие, можете подготовиться с помощью курса «Инженер облачных сервисов».

Читать полностью…

Анализ данных (Data analysis)

Центральный университет приглашает на день открытых дверей интересующихся ИТ-сферой!

Встреча пройдет в штаб-квартире Тинькофф и, помимо рассказа об университете и его программах обучения, участники смогут записаться на индивидуальную консультацию по поступлению и профориентации с представителями университета на любое удобное время и дату.

Что еще будет на дне открытых дверей:
– выступление об обучении и правилах поступления от ректора университета Евгений Ивашкевич;
– руководители программ подробнее расскажут о том как проходит обучение по каждой специализации;
– неформальная атмосфера и нетворкинг с командой университета и с ребятами из других школ.

День открытых дверей пройдет 12 апреля, начало в 19:00, а еще можно подключиться онлайн на YouTube-канале! Регистрация и более подробно здесь.

erid:2Vtzqw1xDtJ
Реклама, АНО ВО «Центральный университет», ИНН 7743418023

Читать полностью…

Анализ данных (Data analysis)

Приглашаем в Гостиную к Алисе!

«Гостиная Алисы. Не один дома» — это митап от команды Яндекса для middle+ бэкендеров: доклады о том, как устроена Алиса, Умные устройства, Беспилотные технологии и нетворкинг в неформальной обстановка

🔸 Павел Капля, руководитель продуктовой разработки Алисы. Расскажет, как запускали Новые возможности — и что пришлось изменить в нашем помощнике, чтобы заставить её думать по новому

🔸 Марат Мавлютов, руководитель службы разработки роботов-доставщиков. Объяснит, как наши роботы-доставщики видят мир вокруг себя, строят маршрут, ориентируются в толпе и проезжают светофоры
18 апреля, 19:00
Москва
Зарегистрироваться можно здесь.

Реклама ООО "Яндекс"
ИНН 7736207543

Читать полностью…

Анализ данных (Data analysis)

🔥 Дайджест полезных материалов из мира Data Science за неделю

Инструменты
Command R+ - Новая модель с открытым исходным кодом показывает крутые результаты на уровне с GPT-4 и Claude 3. 104 миллиарда параметров, 128к контекста
LLocalSearch - полностью локально работающая система метапоиска, использующая LLM-агентов.
DINO-Tracker: Новая SOTA для отслеживания объектов.
Stable Audio 2.0 Stability AI представили нейросеть Stable Audio 2.0 для генерации треков с вокалом.
MagicLens: новое семейство моделей для поиска изображений от Google.
SV3D - еще один проект от Stability AI- новая модель для реконструкции изображения в 3D в хорошем качетсве.
Gaussian Head Avatar - качественная генерация ваш 3D-аватаров сразу с нескольких ракурсов.
Financial Datasets - это библиотека Python с открытым исходным кодом, которая позволяет разработчикам создавать синтетические наборы финансовых данных с использованием больших языковых моделей

Почитать:
Как OpenAI создавали бота, который победил проигроков в Dota 2
Огромный список лучших бесплатных курсов Data Science.
Аппаратные требования больших языковых моделей ИИ сокращаются вдвое каждые восемь месяцев
Fashion is ML profession! Материалы митапа
Как обнаружить галлюцинации в LLM?
Браузерная интерактивная игра от tensorflow, которая позволяет настраивать и обучать нейросеть
Mixture-of-Depths: распределение вычислений в LLM на основе трансформеров
Как мы реализовали текстовый поиск за 48 часов
Большая подборка вопросов для собеседования по DS, AI, ML, DL, NLP, компьютерному зрению
Open Source в российском ИИ: исследование ландшафта
Размышления о высококачественных данных, собранных людьми
Идеи улучшения точности, удобства и скорости языковых моделей
Введение в нейросети: что, зачем и как?
Как я стал специалистом по машинному обучению. Open AI и Dota 2
Introduction to LLM Ops: Reliable and Scalable LLM Integration
JRDB-PanoTrack: An Open-world Panoptic Segmentation and Tracking Robotic Dataset
Machine Learning in Application Development
Let's detect flowers! (with SageMaker and DeepLens)
FiftyOne Computer Vision Tips and Tricks - April 5, 2024
Trustworthy AI: Navigating the Ethical Challenges of AI Deployment and Decision-Making
SVM and Kernels: The Math that Makes Classification Magic
Get Hired Faster: How to use Lyzr-Automata to draft personalised cold emails
AI: The new Frontier Of War
Auto-Merging: RAG Retrieval Technique
Sentence Window Retrieval: Optimizing LLM Performance

Посмотреть:
🌐 Введение в Трансформеры от
3Blue1Brown. Неповторимый стиль автора, красивая анимация и подробное разъяснение сложных тем простыми словами
(⏱ 27:13)
🌐 Эндрю Ын рассказывает о том, как будут развиваться ИИ-агенты (⏱ 13:39)
🌐 100 вопросов с собеседований Data Science (⏱ 36:48)
🌐 Continual Learning of Natural Language Processing Tasks with Bing Liu, PhD (⏱ 46:38)
🌐 Navigating the GENAI Frontier: Empowering Data Scientists as Ethical Innovators with Alison Cossette (⏱ 35:19)
🌐 Vision To Make 1% Top Data Data Scientist (⏱ 09:08)
🌐 ИИ против ИИ в Street Fighter III (⏱ 09:01)

Хорошего дня!

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

🚀 Альфа-Банк приглашает системных аналитиков на One Day Offer. 13 апреля пройдите все этапы собеседования и получите оффер за один день. 

Принять участие: https://cnrlink.com/alfaododataanalysis

Альфа-Банк ищет специалистов, которые возьмут на себя разработку архитектуры взаимодействия внутренних учётных систем банка. На первом этапе – обучение и погружение, затем – постепенное усложнение задач. 

Ожидания от кандидатов:
1️⃣ Опыт работы системным аналитиком от 2 лет.
2️⃣ Умение писать базовые SQL-запросы.
3️⃣ Понимание принципов межсистемной интеграции.
4️⃣ Опыт написания документации и описания функциональности.

Формат работы – на выбор: полная удалёнка, гибрид или офис в Москве, Санкт-Петербурге или Екатеринбурге с гибким графиком.

⏰ One Day Offer Альфа-Банка пройдёт в онлайн-формате 13 апреля. Успейте подать заявку до 11 апреля, чтобы принять участие в мини-игре с призами и получить приглашение на собеседование: https://cnrlink.com/alfaododataanalysis

Реклама. АО "АЛЬФА-БАНК". ИНН 7728168971. erid: LjN8KBTnL

Читать полностью…

Анализ данных (Data analysis)

⚡️Компания Аванпост в поисках Системного аналитика уровня (middle+)

🚀Какие задачи предстоит решать?
- Собирать и вести реестр функциональных и нефункциональных требований заказчиков
- Анализировать требования технических и бизнес-заказчиков на предмет соответствия концепции продуктов
- Участвовать в планировании разработки продукта
- Готовить функциональные требования и постановки к реализации для разработчиков (в Confluence/Jira)
- Участвовать в подготовке документации по продуктам в кооперации с техническими писателями

👨‍💻Какие требования к кандидатам?
- Технический бэкграунд с пониманием процесса разработки программного обеспечения
- Понимание сетевых технологий и протоколов на верхнем уровне;
- Понимание технической документации (RFC и т.д.) на английском и русском языке, умение выделять ключевые аспекты, важные для решения поставленной задачи
- Навык подготовки диаграмм и схем в любом инструменте и любой нотации для донесения смысла и идей
- Навык описания требований в любом формате

🔥Что мы предлагаем:
- Конкурентную заработную плату
- Интересные задачи
- Условия работы в соответствии с ТК РФ + социальный пакет
- Формат работы — удаленно или в офисе (возможен гибридный)
- Классную команду и корпоративные мероприятия
- Гибкий рабочий график

Узнал себя?
Принимай участие в One Day Offer и становись частью крупной IT-компании!

Отправь резюме, пройди собеседование и получи предоффер в Аванпост за пару дней!
📆Даты: 19 Апреля 2024
📍Формат: Гибридный
⏳Дедлайн регистрации: 16 Апреля 2024

Подробности и регистрация: https://www.zavodit.ru/ru/vacancy/item/35

Реклама. ООО "Акселератор Возможностей".
ИНН 9704005146.
erid 2Vtzquk8u1G

Читать полностью…

Анализ данных (Data analysis)

💻Анализ данных и статистика в R

Держите отличный справочник по работе с R от Ивана Позднякова.
Здесь описывается практически всё, вышло аж на 672 страницы

📎 PDF

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

🌟 Шпаргалка по Polars

Polars — это высокопроизводительная библиотека для анализа данных с помощью Python.
Polars разработана с упором на крупномасштабную обработку данных.

Держите отличную шпаргалку по Polars, которая поможет освежить основные моменты
📎 PDF

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

⭐️ Autolabel

Если вам уже наскучили задачи NLP, такие как:

- кластеризация документов (Classification);
- распознавание именованных сущностей (Named Entity Recognition);
- связывание именованных сущностей (Entity Matching);
- оценка эмоциональной окраски (Sentiment Analysis);
- поиск ответа в тексте и многое другое.

То вам помогут LLM. Библиотека Autolabel быстро и бесплатно решает эти задачи, причем выбор модели остается за вами.

pip install refuel-autolabel

Github

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

🦾 Обучите и запустите GPT-2

Андрей Карпатый выпустил llm.c для CUDA.

Все это в одном файле llm.с и по-прежнему всего ~ 1000 строк кода чистого C.

Текущее время выполнения каждой итерации в е <3 A 100 40GB PCIe, B=4, T=1024:
- llm.c: 111 мс
- PyTorch: 180 мс
- +torch.compile: 86 мс
- +тензорные ядра fp32: 26 мс

Github

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

🔥 Бесплатный интенсив по Python для начинающих аналитиков!

Завтра в 19:00 по Мск пройдет бесплатный интенсив по теме: “RFM-анализ клиентской базы с помощью Pandas в Python”.

Что вас ждет:

◾️ 1 живая обучающая лекция, теория и много-много практики на настоящем коммерческом кейсе – скучно не будет 🙂
◾️ Конспект лекции по пройденному материалу
◾️ Бонус – шпаргалка по RFM-анализу!

Что будем делать на интенсиве:

◾️ Проанализируем реальную клиентскую базу аптечной сети
◾️ Напишем скрипт для проведения RFM-анализа
◾️ Изучим несколько классных фишек Pandas и сформулируем конкретные бизнес-выводы

❗️ Интенсив подойдет всем — от новичков до тех, кто уже знаком с Python: мы будем подробно объяснять каждый свой шаг и будем много говорить про аналитику на примере реальной бизнес-задачи – такой опыт точно будет вам полезен 😊

🔗 Регистрируйтесь на интенсив здесь → ссылка.


Реклама. ООО «АЙТИ РЕЗЮМЕ». ИНН 4025460134.
Erid:LjN8KQttm

Читать полностью…

Анализ данных (Data analysis)

Не устраивает уровень скиллов в ML? 

Прокачайте работу с моделями прогнозирования временных рядов! Всего за пару часов можно:

- понять, на какие параметры временного ряда необходимо обращать внимание при его предобработке;- научиться строить модели, способные заглянуть в будущее;- подготовить модель, прогнозирующую следующие значения временного ряда и лучше понять мир построения прогнозов. 

Встречаемся 15 апреля в 20:00 мск на бесплатном практическом уроке от OTUS. Спикер Игорь Стурейко — Teamlead и главный инженер проекта НИИгазэкономика.

Занятие будет приурочено к старту курса «Machine Learning. Advanced». Доступно обучение в рассрочку.

Пройдите короткий тест прямо сейчас, чтобы посетить вебинар и получить запись: https://otus.pw/yuiG/?erid=LjN8K72VL

Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.

Читать полностью…

Анализ данных (Data analysis)

Gemma от DeepMind теперь умеет генерировал качественный код! 🤯 🔔

Code Gemm - набор моделей с открытым кодом. Code Gemma доступен в двух разных размерах 2B и 7B.

🧮 2B и 7B с контекстом 8192 тыс.
🛫 инициализирован из базы Gemma
🔠 Обучен на 500 тыс. токенах (веб, код и математика)
🛠 Отлаженный инструктаж с помощью SFT и RLHF
✅ 2B достигает 27% при оценке пользователем, а 7B - 52%%
✅ Разрешено коммерческое использование
✅ Оптимизировано для генерации кода на любомустройстве
✅ Доступно на huggingface

Blog: https://hf.co/blog/codegemma
Models: https://huggingface.co/models?library=transformers&amp;sort=trending&amp;search=google%2Fcodegemma
Report: https://goo.gle/codegemma
Google Blog: https://developers.googleblog.com/2024/04/gemma-family-expands.html

@machinelearning_ru

Читать полностью…

Анализ данных (Data analysis)

⚡ LitGPT: Pretrain, finetune, deploy 20+ LLMs on your own data

Более 20+ SOTA моделей, которые вы можете использовать на собственных датасетах.

✅ fp4/8/16/32
✅ LoRA, QLoRA, Adapter (v1, v2)
✅ flash attention
✅ FSDP
✅ 1-1000+ GPUs/TPUs

Github

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

⚡️ Млн+ часов YouTube для обучения GPT-4

OpenAI расшифровала более миллиона часов видео с YouTube для обучения GPT-4, воспользовавшись лазейкой в законе об авторском праве. Компания использовала свою модель транскрипции аудио Whisper. Президент OpenAI Грег Брокман лично участвовал в сборе видео.

Представитель OpenAI Линдси Хелд сообщила, что компания использует «многочисленные источники, включая общедоступные данные и партнёрские отношения», а также изучает возможность создания собственных синтетических данных.

Представитель Google Мэтт Брайант отметил, что «как файлы robots.txt, так и Условия обслуживания запрещают несанкционированное сканирование или загрузку контента YouTube». По его словам, Google принимает «технические и юридические меры» для предотвращения такого использования. При этом сама компания обучала свои модели «на некотором контенте YouTube в соответствии с соглашениями с авторами».

В статье The New York Times говорится, что OpenAI исчерпала запасы полезных данных в 2021 году. К тому времени она обучила модели на данных, которые включали компьютерный код из Github, базы данных шахматных ходов и материалы школьных заданий из Quizlet. Эксперты считают, что запас доступного для обучения контента иссякнет к 2028 году. После этого оно будет производиться на синтетических данных, созданных другим ИИ. Эксперты допускают, что некоторые компании также могут преднамеренно пойти на нарушение авторских прав.

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

⚡️ BertViz - это интерактивный инструмент для визуализации работы механизма внимания в моделях основаных на Трансформерах, таких как #BERT, GPT2 и T5.

Инструмент дает представление о процессе принятия решений в модели и о том, как она распределяется внимание между различными частями входных данных.

Github

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

А/Б тестирование на маленьких выборках. Построение собственного критерия

Держите полезный контент)
В этой статье мы:
рассмотрим кейс, в котором классические статистические критерии не работают
разберёмся, почему так происходит
научимся строить свои собственные критерии по историческим данным
обсудим плюсы и минусы такого подхода.

📎 Статья

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

💛 Visualizing Attention, a Transformer's Heart

Внимание - ключевой механизм в трансформерах и LLM. В этом видео представлен подробнейший разбор механизма внимания с красивой анимацией.

Новый крутой ролик от 3Blue1Brown.

Видео

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

🖥 Задачи ML на Swift без Python, нейронных сетей и библиотек

Для решения задач ML большинство разработчиков предпочитают интегрировать библиотеки Python в свой язык/среду, вместо рассмотрения альтернативных решений (а они есть).

В статье предлагается решить классическую задачу ML, используя язык Swift без использования библиотек.

Статья не является руководством по написанию на Swift, а показывает, что ML задачи можно решать не только с помощью Python, и в этом даже есть плюсы

📎 Статья

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

📌Mixture-of-Depths: распределение вычислений в LLM на основе трансформеров

Это совершенно гениальная идея сделать модели на основе трансформеров более эффективными.

Немного деталей:
Mixture-of-Depths уменьшает объем внимания, доступного каждому уровню, и заставляет нейронную сеть обращать внимание на важную информацию.

Использование Mixture-of-Depths минимизирует потери вычислений и обеспечивает динамическое распределение вычислений на основе входной последовательности.

Mixture-of-Depths ограничивает количество токенов, которые могут участвовать в вычислениях self-attention и MLP на данном уровне.

Токены, подлежащие обработке, определяются сетью с использованием механизма маршрутизации top-k.

Метод Mixture-of-Depths использует статический граф вычислений с известными размерами тензора.

Вычислительные затраты в целом предсказуемы, но динамичны и зависят от контекста на уровне токенов.

📎 Исследование, посвящённое Mixture-of-Depths

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

📌Machine learning pipeline — основы. Cookiecutter и Hydra

Простые проекты по Data Science делаются в Jupyter Notebooks и это нормально.
Но с увеличением сложности начинаются проблемы; например, вы строите несколько типов моделей с несколькими вариантами заполнения пропусков (среднее, медиана), генерируете набор feature engineering и применяете разные варианты разбиения выборки.
Можно разместить весь этот код в один Jupyter Notebooks и логгировать метрики и конфиги. Код получится громоздкий и не поворотливый. Для запуска экспериментов надо будет или перескакивать или комментировать ячейки, которые не нужно запускать.

Для решения этих проблем рекомендую использовать pipeline для автоматизации рабочих процессов машинного обучения. Основная цель создания пайплайна — это контроль. Хорошо организованный пайплайн делает реализацию более гибкой.
Об этом и идёт речь в статье, а также о Cookiecutter и Hydra, которые помогают строить пайплайны.

📎 Статья

@data_analysis_ml

Читать полностью…
Subscribe to a channel