Совсем скоро стартует самая крупная конференция от Open Data Science-сообщества — Data Fest 2024. Приглашаем вас провести 29 мая в гостях у ВТБ: в программе DS-квиз, лекции от экспертов и нетворкинг 💙
Программа начнётся в 13.30 и продлится до 19.30. Послушаем доклады в рамках всех сессий феста: NLP, MLOps, Scoring и Data Fusion. Для вас выступят эксперты из ВТБ, Т1, Сбера, Ozon Fintech, Lamoda и многие другие! Подробное расписание с докладами можно посмотреть здесь.
А после всех докладов в 20.00 стартуем с DS-квизом – это как классический «Квиз, Плиз!», только с вопросами по ML/DS-тематике. Чтобы принять участие в игре, регистрируй свою команду заранее по этой ссылке (количество мест для участия ограничено, набираем только 18 команд).
Явки и пароли:
❗️Не забудьте зарегистрироваться на мероприятие, вход будет по спискам
📍Москва, Красный Октябрь (Старт Хаб), Берсеневская набережная, 6 стр.3, этаж 5
Не упустите возможность узнать много нового, обменяться опытом и укрепить профессиональные связи! До встречи 29 мая 💙
Реклама. ПАО Банк ВТБ. ИНН 770207013. 0+
Erid: 2Vtzqv1HHyU
Друзья, этой осенью состоится грандиозное событие: Ai Conf 2024 – первая прикладная конференция по Data Science.
Программа будет строиться вокруг областей применения машинного обучения, а к выступлению приглашены не только спикеры из отраслей IT, ECommerce, но и реальный сектор.
Основные темы конференции:
- звук, зрение, изображения
- обработка естественного языка
- рекомендательные системы и поиск
- умные механизмы
- оптимизация использования железа и др.
До 15 июня принимаются заявки на доклады. Есть чем поделиться - подайте заявку https://tglink.io/306d5a32d69c.
А 23 мая в 18:00 приглашаем на встречу докладчиков с программным комитетом, где обсудим какие темы будут актуальны на AI Conf. Встреча онлайн, регистрируйтесь на сайте!
Подробности о конфeренции AiConf 👉 https://tglink.io/aa23c3612693
Получите до 76 000 руб. на обучение в сфере ИИ
Выберите подходящее обучение от Университета Иннополис с господдержкой.
Профессия «Архитектор в области ИИ» 👉 Забронировать место
Аналитика данных и машинное обучение 👉 Забронировать место
Профессия «Руководитель проектов в области ИИ» 👉 Забронировать место
+ Удостоверение о повышении квалификации
erid: LjN8Jwcvy
Все о безопасной разработке расскажут на PHDays Fest 2 в Лужниках 23-26 мая. Positive Technologies вместе с сообществом POSIdev подготовили несколько секций с докладами для разработчиков:
🔥 General development
🔥 Development Security
🔥 Platform Engineering
🔥 Data Engineering
🔥 Team Lead
🔥 Python совместно с сообществом Moscow Python
🔥 Dev tools, languages & frameworks
Спикеры из Samokat, Тинькофф, СберМаркет, Yandex Cloud, Kaspersky, Lamoda Tech, Aвито, Positive Technologies и других компаний расскажут про архитектуру распределенных систем, безопасную разработку приложений, алгоритмы, языки и инструменты разработки, управление командой и не только.
В перерывах можно будет поиграть в IT-крокодила, решить безопасный кроссворд, выиграть полезную книгу или просто отдохнуть в лаунж-зоне. А в субботу, 25 мая, участвуйте в воркшопах экспертов из Positive Technologies, Yandex Cloud и Hilbert Team, Wildberries или в олимпиаде по программированию.
👉 Программа
👉 Регистрация
Академия Аналитиков Авито открывает новый набор.
Учись у практиков. Решай задачи бигтеха.
Прокачайся как аналитик данных или DS-инженер.
Такая строчка в резюме = буст к карьере.
➡️API и начинающий системный аналитик — разбираем все по полочкам
Хотите стать востребованным системным аналитиком и находитесь в начале пути? Приходите на открытый практический урок от OTUS и узнайте:
- что представляет собой проектирование API для аналитика;
- как увидеть, что API нужен;- с чего начать и где искать требования;
- что нужно собрать для проектирования API.
Научимся по шагам проектировать и описывать интеграцию, чтобы ставить разработчикам понятные задачи!
Спикер — ведущий системный аналитик, сертифицированный менеджер и опытный преподаватель.
Встречаемся 20 мая в 19:00 мск в рамках курса «Специализация системный аналитик». Все участники вебинара получат специальную цену на обучение и персональную консультацию от менеджеров OTUS!
🔜Регистрируйтесь прямо сейчас, чтобы не пропустить бесплатный урок и получить специальную скидку на обучение: https://otus.pw/Vk7h/
Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963. erid: LjN8KRAso
Хотите попробовать себя в роли аналитика и попрактиковаться на реальных задачах?
Приходите на бесплатный курс-симулятор Нетологии и Yandex Cloud «Основы анализа данных в SQL, Python, Power BI, DataLens».
В этой профессии много разных направлений — аналитик данных, BI-аналитик, продуктовый аналитик, Data Scientist. Но везде пригодится навык работы с инструментами-помощниками, которые вы и освоите на курсе.
Эксперты-практики расскажут, как делать простые отчёты, исследовать данные и строить интерактивные дашборды. А чтобы понять, что анализ данных — это точно ваше, вместе решите практические задачи из реальных кейсов.
Воспользуйтесь шансом попробовать новые инструменты и запишитесь на бесплатный курс Нетологии.
Регистрация: https://netolo.gy/c9KL
Реклама. ООО "Нетология" LatgBc6EZ
Эффективный метод быстрого освоения ChatGPT.
Обучение нейронной сети и создание правильных промптов – это длительный процесс, который требует значительного времени.
Здесь разработан краткий курс из 5 уроков по ChatGPT. После его завершения вы сможете создать 9 нейронных сетей, которые помогут вам:
- находить ошибки и оптимизировать код
- генерировать посты в Телеграме
- создавать заголовки для рекламы
- делегировать рутинные задачи нейронке
Вы также сможете разработать своих собственных нейро-помощников для продаж, маркетинга и других целей.
Бесплатный доступ предоставляется сразу после регистрации.
Реклама. ООО "ТЕРРА ЭЙАЙ". ИНН 9728019395. erid: LjN8JvcZb
Не представляете свою жизнь без математики и хотите применять её в работе над IT-проектами?
Научиться этому помогут короткие образовательные программы от экспертов-практиков. Плюсы таких форматов — большой объём полезной информации в короткий срок, фокус на узкие дисциплины, новые проекты в портфолио, а также активный нетворкинг и обмен идеями.
Где найти такие программы? Например, у Яндекс Образования. В июле у них стартует студкемп по математике в ИИ на базе Иннополиса. За две недели вы погрузитесь в актуальные вопросы машинного обучения и больше узнаете о математических методах в искусственном интеллекте.
На бесплатной программе ждут студентов старших курсов, обучающихся по направлению Computer Science. Подать заявку можно до 26 мая. Всем, кто успешно пройдёт отбор, организаторы оплатят дорогу и проживание. Переходите на сайт прямо сейчас и заполняйте анкету! Поторопитесь, количество мест ограничено.
Игнорирование больших данных и нейросетей сегодня — почти гарантия провала. Именно поэтому стоит начать погружение в востребованную сферу Data Science и понять, чем занимаются специалисты по машинному обучению и анализу данных. За 5 дней вы узнаете, как работают нейросети, и создадите свою для поиска новостей.
📌 Зарегистрируйтесь прямо сейчас и получите эксклюзивный бонус — гайд «Как пользоваться ChatGPT и Midjourney + 25 полезных нейросетей»: https://epic.st/aP_hhJ?erid=2VtzqvfoxFK
Что будем делать на мини-курсе:
— Узнаем, где востребована наука о данных, и разберёмся в различиях 3 основных направлений
— Освоим азы языка Python и визуализируем данные с его помощью
— Изучим базовые конструкции языка SQL
🎁 Вас ждут подарки:
— Год бесплатного изучения английского языка
— Персональная карьерная консультация
— 5 полезных чек-листов для старта карьеры
🎉 Все участники мини-курса получат сертификат на скидку 10 000 рублей на любой курс Skillbox.
Реклама. ЧОУ ДПО «Образовательные технологии «Скилбокс (Коробка навыков)», ИНН: 9704088880
Вас заменит не искусственный интеллект, а те, кто будет работать с ним.
Не дайте таким специалистам шанс отобрать у вас место в компании мечты — записывайтесь на бесплатный онлайн-практикум «Как не потерять работу из-за ИИ: погружаемся в аналитику и Data Science».
За 2 дня вы:
- узнаете, чем занимаются аналитик данных и Data Scientist
- попробуете эти профессии на практике
-определите, какое направление вам больше подходит
- наметите карьерный план и заберете подарки
Зарегистрироваться бесплатно: https://go.skillfactory.ru/&erid=2VtzqvUpTXF
Реклама ООО "Скилфэктори", ИНН 9702009530
🫖 Слёрм набирает новый поток курса «Data-инженер»
Кто владеет информацией, тот владеет миром. А Data-инженер умеет выстраивать рабочие гипотезы и помогает бизнесу решать бизнес-запросы. А вы можете освоить инструменты и подходы Data-инженера на курсе от Слёрм.
Старт 3 июня. Записаться на курс можно по ссылке ⬅️
Вы освоите наиболее популярные инструменты Data-инжениринга: Bash, Hadoop, Spark, PostgreSQL, ClickHouse, AirFiow, Nifi, Kafka, Neo4j, MongoDBI и другие. Это обширный и полноценный курс, который охватывает как базовые темы, так и более сложный материал.
Эксперты курса:
🔎 Николай Марков. Работал с сетями, протоколами и различными облаками (AWS, GCP, Azure, OpenStack), писал проекты на Python, а также Golang, C/C++, Scala и Rust. Сейчас выстраивает аналитические архитектуры и Data Governance в разных компаниях.
🐍 Николай Акимов, инженер по внедрению в TaskData. В профессиональном IT уже более 20 лет. Активно участвует в Open Source проектах на Github, поддерживает сообщество NiFi.
🌺Ася Гайламазян. Работала в сферах телекоммуникаций, игровой индустрии, розничных и оптовых продажах в роли разработчика системного обеспечения.
Как проходит обучение:
Эксперты рассматривают каждую тему в коротких видеоуроках.
После каждого занятия будут идти практические задания и тесты — можно пройти теорию и сразу закрепить её.
В заданиях вы можете развернуть стенды и отработать учебный материал на практике.
Всех студентов мы соберем в одном чате в Telegram: здесь можно будет поделиться инсайтом, задать вопрос кураторам и экспертам курса.
После каждого тематического блока спикеры курса готовы будут встретиться с вами на онлайн-сессиях и обсудить возникшие сложности, ответить на любые вопросы по учебной программе.
Старт 3 июня. Записаться на курс можно по ссылке
Реклама ООО «Слёрм» ИНН 3652901451
Yandex приглашает поучаствовать в Practical ML Conf 14 сентября!
На конференции поговорим о том, как применять ML-технологии в бизнесе и реальных продуктах. Регистрируйтесь уже сейчас — те, кто сделает это раньше всех, попадут на закрытый мини-ивент в июле.
А если хотите поделиться своим опытом в ML, станьте спикером, оставив заявку. Ключевые темы конференции — CV, RecSys, MLOps, NLP, Speech и Analytics. После подачи программный комитет рассмотрит заявки и примет решение об участии каждого претендента.
🔹 Сбор заявок завершится 13 июля.
Реклама. ООО "Яндекс", ИНН 7736207543.
🖥 Вышла новая, улучшенная версия GPT-4 Omni для. И что самое главное — она доступна всем БЕСПЛАТНО!
Это самая совершенная модель из всех, намного превосходящая своих предшественников, включая таинственный gpt2-chatbot.
Она появится уже сегодня в виде приложения для пк.
GPT-4 Omni будет понимать эмоции и тон голоса.
@ai_machinelearning_big_data
📌Featuretools для генерации признаков
— python -m pip install featuretools
Featuretools — это Python библиотека для автоматизированной разработки фич, т.е. определения переменных из набора данных для обучения ML-модели.
Featuretools отлично справляется с преобразованием временных и реляционных наборов данных в матрицы признаков для машинного обучения.
🖥 GitHub
🟡 Доки
@data_analysis_ml
⚡️ Большая шпаргалка-учебник по ML
Здесь и основная теория по Machine Learning, и примеры реализации конкретных ML-алгоритмов — в общем, самое то, чтобы освежить базу перед собеседованием
📎 Шпаргалка
@data_analysis_ml
⚡️ Google представили CAT3D: Инструмент для 3D генераций, с помощью диффузионных моделей
Создавайте 3D-сцены из любого количества реальных или сгенерированных изображений
proj: https://cat3d.github.io
abs: https://arxiv.org/abs/2405.10314
@data_analysis_ml
🌟 GPT-4o доступна в предварительной версии службы Microsoft Azure
Новейшая модель ChatGPT-4o от OpenAI теперь доступна в предварительной версии службы Microsoft Azure.
Microsoft заявила, что клиенты службы могут изучить обширные возможности GPT-4o с помощью песочницы в Azure OpenAI Studio. Она частично доступна в США. В первом выпуске основное внимание уделяется вводу текста и изображений.
🟡 Подробнее
▶️ Azure AI Studio
@data_analysis_ml
🌟 ydata-profiling — быстрое создание отчётов на основе данных
— pip install ydata-profiling
ydata-profiling — это библиотека Python для профилирования данных, которая автоматизирует и стандартизирует создание подробных отчетов, дополненных статистикой и визуализацией.
Фишка ydata-profiling в том, что она позволяет подготовить данные к анализу всего 1 строкой кода
Использование ydata-profiling может выглядеть так:
import pandas as pd
from ydata_profiling import ProfileReport
df = pd.read_csv('data.csv')
profile = ProfileReport(df, title="Profiling Report")
🔥 PyTorch реализация GPTs с использованием нейросетей Колмогорова-Арнольда (KAN)
Чуть больше недели прошло с анонса нейросети принципиально новой архитектуры (Kolmogorov-Arnold Network), и вот уже первые первые реализации на PyTorch, встречайте
— pip install kan_gpt
🖥 GitHub
@data_analysis_ml
🌟 Пошаговая реализация архитектуры Transformer
В этом ноутбуке максимально подробно описан каждый шаг реализации трансформера с нуля, с необходимым теоретическим минимумом
Для полного просветления можно скомбинировать с видео 3blue1brown">3b1b
▶️ Jupyter Notebook
@data_analysis_ml
🖥 Phidata — фреймворк для добавления памяти, знаний и новых опций к LLM
— pip install -U phidata
А вот пара примеров AI-веб-приложений, созданных с помощью Phidata:
🟡 PDF AI — обобщает и отвечает на вопросы из PDF-файлов
🟡 ArXiv AI — отвечает на вопросы о статьях ArXiv, используя ArXiv API
🟡 HackerNews AI — обобщает истории, пользователей и делится тем, что нового на HackerNews
🖥 GitHub
🟡 Доки
@data_analysis_ml
💻 DrawDB — open-source интуитивно понятный онлайн-инструмент для проектирования БД и генерации SQL-запросов
DrawDB — это удобный онлайн-редактор отношений между базами данных и сущностями (DBER).
Позволяет создавать диаграммы в несколько кликов, экспортировать sql-скрипты, настраивать редактор и многое другое без создания учетной записи. Ознакомиться с полным набором функций можно здесь.
Для локального использования:
git clone https://github.com/drawdb-io/drawdb
cd drawdb
npm install
npm run dev
⚡️ Red Hat объявила о выпуске дистрибутива RHEL AI для ML-разработчиков
Red Hat выпустила дистрибутив Red Hat Enterprise Linux AI (RHEL AI), который создали специально для ML-разработчиков. В сборку включены инструменты и фреймворки для работы с моделями машинного обучения.
▶️ Подробнее
@data_analysis_ml
⚡️ xLSTM: расширенная долгая краткосрочная память
С тех пор как LSTM возникли и выдержали испытание временем, они способствовали многочисленным успехам глубокого обучения, в частности, привели к созданию LLM.
Однако появление технологии Transformer с распараллеливаемым самовниманием в основе ознаменовало рассвет новой эры, превзойдя LSTM по масштабу.
Возникают вопросы: как далеко мы можем продвинуться в языковом моделировании при масштабировании LSTM до миллиардов параметров, используя новейшие методы современных LLM, но смягчая известные ограничения LSTM?
• 1 — можно использовать экспоненциальный гейтинг с соответствующими методами нормализации и стабилизации.
• 2 — можно модифицировать структуру памяти LSTM, получая: (I) sLSTM со скалярной памятью, скалярным обновлением и новым смешиванием памяти; (II) полностью распараллеливаемую mLSTM с матричной памятью и правилом обновления ковариации.
Так и возникает xLSTM — расширенная долгая краткосрочная память.
Экспоненциальный гейтинг и модифицированные структуры памяти повышают возможности xLSTM и позволяют сравнить их с современными трансформерами как по производительности, так и по масштабированию.
Держите совсем свежую статью с описанием xLSTM
📎 Arxiv
@data_analysis_ml
🌟 Novu — IaaC инфраструктура уведомлений на основе GitOps. Встроенный центр уведомлений, интеграция с электронной почтой, Push и Slack
Novu — open-source инфраструктура уведомлений;
Novu предоставляет унифицированный API, который упрощает отправку уведомлений по нескольким каналам, включая In-App, Push, Email, SMS и Chat. С Novu можно создавать пользовательские рабочие процессы и определять условия для каждого канала, не беспокоясь, что уведомления будут доставлены наиболее эффективным способом.
🖥 GitHub
🟡 Доки
@data_analysis_ml
⚡️ Plandex — AI-инструмент для создания кода
— curl -sL https://plandex.ai/install.sh | bash
Это open-source AI-инструмент для генерации кода с консольным интерфейсом, который помогает выполнять даже большие задачи.
Для выполнения задач, охватывающих несколько файлов и требующих множества шагов, Plandex использует долго работающих AI-агентов. Большие задачи разбиваются на более мелкие подзадачи, которые затем выполняются — и так пока не будет выполнено всё.
Фишки Plandex:
— позволяет экспериментировать, пересматривать и анализировать в защищенной песочнице, прежде чем применять изменения
— даёт возможность пробовать разные модели и настройки моделей, а затем сравнивать результаты
— облегчает контроль над контекстом и над тем, сколько токенов используется
🖥 GitHub
@data_analysis_ml
🔥 Грег Брокман, соучредитель OpenAI, опубликовал 5-минутное видео, в котором он общается с языковой моделью GPT-4 Omni и демонстрирует ее возможности компьютерного зрения.
А вот еще 33 видео с примерами работы ИИ - https://vimeo.com/openai.
А если интерсно, тут обращение самого Сэма Альтмана - https://blog.samaltman.com/gpt-4o
@ai_machinelearning_big_data
🌟 LLM2Vec — инструмент для преобразования LLM в кодировщик текста
pip install llm2vec
pip install flash-attn --no-build-isolation
Вспомним школьную математику и подготовим к вступительным в магистратуру
16 мая пройдет первый вебинар в рамках онлайн-марафона по подготовке к вступительному экзамену в онлайн-магистратуру "Master of Data Science" Марафон продлится до 3 июня.
Чтобы успешно сдать вступительный экзамен в магистратуру "Master of Data Science", вам нужно знать математику школьного уровня. Обучение рассчитано для поступающих с нулевым уровнем в программировании или желающих изменить свою сферу деятельности.
Марафон будет также полезен всем, кто хочет вспомнить основы базовой математики.
📆 Дата: 16 мая
💻 Формат: онлайн
📕 Зарегистрироваться на онлайн-марафон по ссылке
✏ "Master of Data Science" — онлайн-магистратура на факультете компьютерных наук НИУ ВШЭ, которая реализуется полностью на английском языке.
Реклама. НИУ ВШЭ.
ИНН 7714030726
Erid: 2SDnjccrqVs