data_analysis_ml | Unsorted

Telegram-канал data_analysis_ml - Анализ данных (Data analysis)

10807

Аналитика данных админ - @haarrp @ai_machinelearning_big_data - Machine learning @itchannels_telegram - 🔥лучшие ит-каналы @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚

Subscribe to a channel

Анализ данных (Data analysis)

⚡️ Redka (Red is re-implemented with SQLite)

Выпущена новая версии Redka 1.0. В ней реализованы строки, списки, сеты, хэши, отсортированные сеты, а также управление ключами и транзакциями.

Github

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

🌟 R для не программистов — открытая книга по анализу данных в R от Daniel Dauber

В этой свободно распространяемой книге описывается использование языка R для большого количество реальных кейсов; изложены важные концепции, с которыми сталкивается аналитик данных в своей работе

📎 Книга

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

🔥 Model Explorer — обозреватель моделей от Google

pip install ai-edge-model-explorer
model-explorer


Model Explorer — это инструмент визуализации, который позволяет анализировать модели и графики машинного обучения, ускоряя развертывание на целевых устройствах.

Можно запустить Model Explorer полностью локально в окне браузера.
Ну и конечно же, Model Explorer хорошо работает в Colab, а это означает, что вы можете интегрировать его в существующий рабочий процесс разработки моделей.

🖥 GitHub

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

🌟 DVC — open-source инструмент для управления версиями данных и многого другого, что может понадобиться при работе с AI

brew install dvc

Позволяет управлять данными, используемыми при обучении ML-моделей, такими как изображения, аудио-, видео- и текстовые файлы
Позволяет удобно организовывать воспроизводимые рабочие процессы, связанные с ML.

🖥 GitHub
🟡 Доки

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

Совсем скоро стартует самая крупная конференция от Open Data Science-сообщества — Data Fest 2024. Приглашаем вас провести 29 мая в гостях у ВТБ: в программе DS-квиз, лекции от экспертов и нетворкинг 💙

Программа начнётся в 13.30 и продлится до 19.30. Послушаем доклады в рамках всех сессий феста: NLP, MLOps, Scoring и Data Fusion. Для вас выступят эксперты из ВТБ, Т1, Сбера, Ozon Fintech, Lamoda и многие другие! Подробное расписание с докладами можно посмотреть здесь.

А после всех докладов в 20.00 стартуем с DS-квизом – это как классический «Квиз, Плиз!», только с вопросами по ML/DS-тематике. Чтобы принять участие в игре, регистрируй свою команду заранее по этой ссылке (количество мест для участия ограничено, набираем только 18 команд).

Явки и пароли:
❗️Не забудьте зарегистрироваться на мероприятие, вход будет по спискам
📍Москва, Красный Октябрь (Старт Хаб), Берсеневская набережная, 6 стр.3, этаж 5

Не упустите возможность узнать много нового, обменяться опытом и укрепить профессиональные связи! До встречи 29 мая 💙

Реклама. ПАО Банк ВТБ. ИНН 770207013. 0+
Erid: 2Vtzqv1HHyU

Читать полностью…

Анализ данных (Data analysis)

Друзья, этой осенью состоится грандиозное событие: Ai Conf 2024 – первая прикладная конференция по Data Science. 

Программа будет строиться вокруг областей применения машинного обучения, а к выступлению приглашены не только спикеры из отраслей IT,  ECommerce, но и реальный сектор.

Основные темы конференции:
- звук, зрение, изображения
- обработка естественного языка
- рекомендательные системы и поиск
- умные механизмы
- оптимизация использования железа и др.

До 15 июня принимаются заявки на доклады. Есть чем поделиться - подайте заявку https://tglink.io/306d5a32d69c.

А 23 мая в 18:00 приглашаем на встречу докладчиков с программным комитетом, где обсудим какие темы будут актуальны на AI Conf. Встреча онлайн, регистрируйтесь на сайте!
Подробности о конфeренции AiConf 👉 https://tglink.io/aa23c3612693

Читать полностью…

Анализ данных (Data analysis)

Получите до 76 000 руб. на обучение в сфере ИИ

Выберите подходящее обучение от Университета Иннополис с господдержкой.

Профессия «Архитектор в области ИИ» 👉 Забронировать место

Аналитика данных и машинное обучение 👉 Забронировать место

Профессия «Руководитель проектов в области ИИ» 👉 Забронировать место

+ Удостоверение о повышении квалификации

erid: LjN8Jwcvy

Читать полностью…

Анализ данных (Data analysis)

Все о безопасной разработке расскажут на PHDays Fest 2 в Лужниках 23-26 мая. Positive Technologies вместе с сообществом POSIdev подготовили несколько секций с докладами для разработчиков:

🔥 General development
🔥 Development Security
🔥 Platform Engineering
🔥 Data Engineering
🔥 Team Lead
🔥 Python совместно с сообществом Moscow Python
🔥 Dev tools, languages & frameworks

Спикеры из Samokat, Тинькофф, СберМаркет, Yandex Cloud, Kaspersky, Lamoda Tech, Aвито, Positive Technologies и других компаний расскажут про архитектуру распределенных систем, безопасную разработку приложений, алгоритмы, языки и инструменты разработки, управление командой и не только.

В перерывах можно будет поиграть в IT-крокодила, решить безопасный кроссворд, выиграть полезную книгу или просто отдохнуть в лаунж-зоне. А в субботу, 25 мая, участвуйте в воркшопах экспертов из Positive Technologies, Yandex Cloud и Hilbert Team, Wildberries или в олимпиаде по программированию.

👉 Программа
👉 Регистрация

Читать полностью…

Анализ данных (Data analysis)

Академия Аналитиков Авито открывает новый набор.
Учись у практиков. Решай задачи бигтеха.

Прокачайся как аналитик данных или DS-инженер.
Такая строчка в резюме = буст к карьере.

Читать полностью…

Анализ данных (Data analysis)

➡️API и начинающий системный аналитик — разбираем все по полочкам 

Хотите стать востребованным системным аналитиком и находитесь в начале пути? Приходите на открытый практический урок от OTUS и узнайте:

- что представляет собой проектирование API для аналитика;
- как увидеть, что API нужен;- с чего начать и где искать требования;
- что нужно собрать для проектирования API. 

Научимся по шагам проектировать и описывать интеграцию, чтобы ставить разработчикам понятные задачи!

Спикер — ведущий системный аналитик, сертифицированный менеджер и опытный преподаватель. 

Встречаемся 20 мая в 19:00 мск в рамках курса «Специализация системный аналитик». Все участники вебинара получат специальную цену на обучение и персональную консультацию от менеджеров OTUS! 

🔜Регистрируйтесь прямо сейчас, чтобы не пропустить бесплатный урок и получить специальную скидку на обучение: https://otus.pw/Vk7h/

Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963. erid: LjN8KRAso

Читать полностью…

Анализ данных (Data analysis)

Хотите попробовать себя в роли аналитика и попрактиковаться на реальных задачах?

Приходите на бесплатный курс-симулятор Нетологии и Yandex Cloud «Основы анализа данных в SQL, Python, Power BI, DataLens».

В этой профессии много разных направлений — аналитик данных, BI-аналитик, продуктовый аналитик, Data Scientist. Но везде пригодится навык работы с инструментами-помощниками, которые вы и освоите на курсе.

Эксперты-практики расскажут, как делать простые отчёты, исследовать данные и строить интерактивные дашборды. А чтобы понять, что анализ данных — это точно ваше, вместе решите практические задачи из реальных кейсов.

Воспользуйтесь шансом попробовать новые инструменты и запишитесь на бесплатный курс Нетологии.

Регистрация: https://netolo.gy/c9KL
Реклама. ООО "Нетология" LatgBc6EZ

Читать полностью…

Анализ данных (Data analysis)

Эффективный метод быстрого освоения ChatGPT.

Обучение нейронной сети и создание правильных промптов – это длительный процесс, который требует значительного времени.

Здесь разработан краткий курс из 5 уроков по ChatGPT. После его завершения вы сможете создать 9 нейронных сетей, которые помогут вам:

- находить ошибки и оптимизировать код
- генерировать посты в Телеграме
- создавать заголовки для рекламы
- делегировать рутинные задачи нейронке

Вы также сможете разработать своих собственных нейро-помощников для продаж, маркетинга и других целей.

Бесплатный доступ предоставляется сразу после регистрации.

Реклама. ООО "ТЕРРА ЭЙАЙ". ИНН 9728019395. erid: LjN8JvcZb

Читать полностью…

Анализ данных (Data analysis)

Не представляете свою жизнь без математики и хотите применять её в работе над IT-проектами?

Научиться этому помогут короткие образовательные программы от экспертов-практиков. Плюсы таких форматов — большой объём полезной информации в короткий срок, фокус на узкие дисциплины, новые проекты в портфолио, а также активный нетворкинг и обмен идеями.

Где найти такие программы? Например, у Яндекс Образования. В июле у них стартует студкемп по математике в ИИ на базе Иннополиса. За две недели вы погрузитесь в актуальные вопросы машинного обучения и больше узнаете о математических методах в искусственном интеллекте.

На бесплатной программе ждут студентов старших курсов, обучающихся по направлению Computer Science. Подать заявку можно до 26 мая. Всем, кто успешно пройдёт отбор, организаторы оплатят дорогу и проживание. Переходите на сайт прямо сейчас и заполняйте анкету! Поторопитесь, количество мест ограничено.

Читать полностью…

Анализ данных (Data analysis)

Игнорирование больших данных и нейросетей сегодня — почти гарантия провала. Именно поэтому стоит начать погружение в востребованную сферу Data Science и понять, чем занимаются специалисты по машинному обучению и анализу данных. За 5 дней вы узнаете, как работают нейросети, и создадите свою для поиска новостей.
📌 Зарегистрируйтесь прямо сейчас и получите эксклюзивный бонус — гайд «Как пользоваться ChatGPT и Midjourney + 25 полезных нейросетей»: https://epic.st/aP_hhJ?erid=2VtzqvfoxFK


Что будем делать на мини-курсе:
— Узнаем, где востребована наука о данных, и разберёмся в различиях 3 основных направлений
— Освоим азы языка Python и визуализируем данные с его помощью
— Изучим базовые конструкции языка SQL

🎁 Вас ждут подарки:
— Год бесплатного изучения английского языка
— Персональная карьерная консультация
— 5 полезных чек-листов для старта карьеры

🎉 Все участники мини-курса получат сертификат на скидку 10 000 рублей на любой курс Skillbox.

Реклама. ЧОУ ДПО «Образовательные технологии «Скилбокс (Коробка навыков)», ИНН: 9704088880

Читать полностью…

Анализ данных (Data analysis)

Вас заменит не искусственный интеллект, а те, кто будет работать с ним.

Не дайте таким специалистам шанс отобрать у вас место в компании мечты — записывайтесь на бесплатный онлайн-практикум «Как не потерять работу из-за ИИ: погружаемся в аналитику и Data Science».

За 2 дня вы:
- узнаете, чем занимаются аналитик данных и Data Scientist
- попробуете эти профессии на практике
-определите, какое направление вам больше подходит
- наметите карьерный план и заберете подарки

Зарегистрироваться бесплатно: https://go.skillfactory.ru/&erid=2VtzqvUpTXF

Реклама ООО "Скилфэктори", ИНН 9702009530

Читать полностью…

Анализ данных (Data analysis)

Онлайн-день AvitoTech на Data Fest | 26 мая с 13:00 до 18:00

В программе:

• Общение с рекрутерами и лидами Авито в Spatial Chat;
• Участие в ML System Design Game с Михаилом Каменщиковым, руководителем команды рекомендаций в Авито.

Воркшоп поможет получить опыт работы над крупными проектами и подготовиться к собеседованиям, а также развивать свои идеи в интерактивном формате. Регистрация на онлайн и офлайн-активности по ссылкам.

И помните, 1 июня ожидается большой офлайн-день в московском офисе Авито. Подробности программы здесь.

Читать полностью…

Анализ данных (Data analysis)

Стать сотрудником Яндекса быстрее и проще, чем кажется. Участвуйте в днях быстрого найма: решите тестовое, пройдите несколько секций собеседования и получите офер за несколько дней.

Ближайшее Fast Track мероприятия:

• 8–9 июня — для дата-инженеров, офер за 2 дня в DWH команды Маркета.

Зарегистрироваться

Читать полностью…

Анализ данных (Data analysis)

🔥Подборка лучших обучающих каналов для программистов.

➡️ Делитесь с коллегами и сохраняйте себе, чтобы не потерять

⚡Машинное обучение

Machine Learning - запускаем лучшие ИИ модели, пишем код, погружаемся в нейросети
Ml Собеседование - подготовка к собесу по мл, алгоритмам, коду
Ml ru - актуальные статьи, новости, код и обучающие материалы
Ml Jobs - вакансии ML
ML Книги - актуальные бесплатные книги МО
ML чат

🏆 Golang
Golang
Golang собеседование - разбор задач и вопросов с собесов
Golang вакансии -работа для Go разработчика
Golang книги библиотека книг
Golang задачи и тесты
Golang чат
Golang news - новости из мира go
Golang дайджест

💥 Linux /Этичный хакинг
Linux Academy - гайды, секреты и лучшие материалы по Linux
Kali linux - погрузись в мир этичного хакинга и кибербезопасности
linux_kal - kali чат
Информационная безопасность

🚀 Data Science

Анализ данных - полезные фишки, код, гайды и советы, маст-хэв датасаентиста
Data Jobs - ds вакансии
Аналитик данных
Data Science книги - актуальные бесплатные книги
Big data

🛢Базы данных
Sql базы данных - научим работе с базами данных профессионально
Библиотека баз данных
SQL чат
Вакансии Sql аналитик данных

#️⃣C#

С# академия - лучший канал по c#
С# заметки — код, лучшие практики, заметки программиста c#
С# задачи и тесты
С# библиотека - актуальные бесплатные книги
C# вакансии - работа

🐍 Python

Python/django - самый крупный обучающий канал по Python
Python Собеседование - подготовка к собеседовению python и разбор алгоритмов
Pro python - статьи, новости, код и обучающие материалы
Python Jobs - вакансии Python
Python чат
Python книги

☕ Java

Java академия - java от Senior разработчика
Java вакансии
Java чат
Java вопросы с собеседований
Java книги

💻 C++

C++ академия
С++ книги
C++ задачи - подготовка к собеседовению мл, алгоритмам
C++ вакансии

⚡️ Frontend
Javascript академия - крупнейший js канал
React - лучшие гайды и советы по работе с react
Frontend - тутрориалы, уроки, гайды, код
PHP
Книги frontend
Задачи frontend

🦀 Rust
Rust программирование
Rust чат
Rust книги для программистов

📲 Мобильная разработка
Android разработка
Мобильный разработчик гайды и уроки

🇬🇧 Английский для программистов

🧠 Искусственный интеллект
ИИ и технологии
Neural - нейросети для работы и жизни
Книги ИИ
Artificial Intelligence

🔥 DevOPs
Devops для программистов
Книги Devops

🌟 Docker/Kubernets
Docker
Kubernets

📓 Книги
Библиотеки Книг для программситов

💼 Папка с вакансиями:
Папка Go разработчика:
Папка Python разработчика:
Папка Data Science
Папка Java разработчика
Папка C#
Папка Frontend

💥 Бесплатный Chatgpt бот

Читать полностью…

Анализ данных (Data analysis)

🖥 Запиливаем новый проект по машинному обучению.

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

⚡️ Большая шпаргалка-учебник по ML

Здесь и основная теория по Machine Learning, и примеры реализации конкретных ML-алгоритмов — в общем, самое то, чтобы освежить базу перед собеседованием

📎 Шпаргалка

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

⚡️ Google представили CAT3D: Инструмент для 3D генераций, с помощью диффузионных моделей

Создавайте 3D-сцены из любого количества реальных или сгенерированных изображений

proj: https://cat3d.github.io
abs: https://arxiv.org/abs/2405.10314

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

🌟 GPT-4o доступна в предварительной версии службы Microsoft Azure

Новейшая модель ChatGPT-4o от OpenAI теперь доступна в предварительной версии службы Microsoft Azure.

Microsoft заявила, что клиенты службы могут изучить обширные возможности GPT-4o с помощью песочницы в Azure OpenAI Studio. Она частично доступна в США. В первом выпуске основное внимание уделяется вводу текста и изображений.

🟡 Подробнее
▶️ Azure AI Studio

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

🌟 ydata-profiling — быстрое создание отчётов на основе данных

pip install ydata-profiling

ydata-profiling — это библиотека Python для профилирования данных, которая автоматизирует и стандартизирует создание подробных отчетов, дополненных статистикой и визуализацией.
Фишка ydata-profiling в том, что она позволяет подготовить данные к анализу всего 1 строкой кода

Использование ydata-profiling может выглядеть так:

import pandas as pd
from ydata_profiling import ProfileReport

df = pd.read_csv('data.csv')
profile = ProfileReport(df, title="Profiling Report")


🖥 GitHub

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

🔥 PyTorch реализация GPTs с использованием нейросетей Колмогорова-Арнольда (KAN)

Чуть больше недели прошло с анонса нейросети принципиально новой архитектуры (Kolmogorov-Arnold Network), и вот уже первые первые реализации на PyTorch, встречайте

pip install kan_gpt

🖥 GitHub

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

🌟 Пошаговая реализация архитектуры Transformer

В этом ноутбуке максимально подробно описан каждый шаг реализации трансформера с нуля, с необходимым теоретическим минимумом
Для полного просветления можно скомбинировать с видео 3blue1brown">3b1b

▶️ Jupyter Notebook

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

🖥 Phidata — фреймворк для добавления памяти, знаний и новых опций к LLM

pip install -U phidata

А вот пара примеров AI-веб-приложений, созданных с помощью Phidata:
🟡 PDF AI — обобщает и отвечает на вопросы из PDF-файлов
🟡 ArXiv AI — отвечает на вопросы о статьях ArXiv, используя ArXiv API
🟡 HackerNews AI — обобщает истории, пользователей и делится тем, что нового на HackerNews

🖥 GitHub
🟡 Доки

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

💻 DrawDB — open-source интуитивно понятный онлайн-инструмент для проектирования БД и генерации SQL-запросов

DrawDB — это удобный онлайн-редактор отношений между базами данных и сущностями (DBER).
Позволяет создавать диаграммы в несколько кликов, экспортировать sql-скрипты, настраивать редактор и многое другое без создания учетной записи. Ознакомиться с полным набором функций можно здесь.

Для локального использования:


git clone https://github.com/drawdb-io/drawdb
cd drawdb
npm install
npm run dev


GitHub
Перейти в редактор

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

⚡️ Red Hat объявила о выпуске дистрибутива RHEL AI для ML-разработчиков

Red Hat выпустила дистрибутив Red Hat Enterprise Linux AI (RHEL AI), который создали специально для ML-разработчиков. В сборку включены инструменты и фреймворки для работы с моделями машинного обучения.

▶️ Подробнее

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

⚡️ xLSTM: расширенная долгая краткосрочная память

С тех пор как LSTM возникли и выдержали испытание временем, они способствовали многочисленным успехам глубокого обучения, в частности, привели к созданию LLM.
Однако появление технологии Transformer с распараллеливаемым самовниманием в основе ознаменовало рассвет новой эры, превзойдя LSTM по масштабу.
Возникают вопросы: как далеко мы можем продвинуться в языковом моделировании при масштабировании LSTM до миллиардов параметров, используя новейшие методы современных LLM, но смягчая известные ограничения LSTM?
• 1 — можно использовать экспоненциальный гейтинг с соответствующими методами нормализации и стабилизации.
• 2 — можно модифицировать структуру памяти LSTM, получая: (I) sLSTM со скалярной памятью, скалярным обновлением и новым смешиванием памяти; (II) полностью распараллеливаемую mLSTM с матричной памятью и правилом обновления ковариации.

Так и возникает xLSTM — расширенная долгая краткосрочная память.
Экспоненциальный гейтинг и модифицированные структуры памяти повышают возможности xLSTM и позволяют сравнить их с современными трансформерами как по производительности, так и по масштабированию.

Держите совсем свежую статью с описанием xLSTM
📎 Arxiv

@data_analysis_ml

Читать полностью…

Анализ данных (Data analysis)

🌟 Novu — IaaC инфраструктура уведомлений на основе GitOps. Встроенный центр уведомлений, интеграция с электронной почтой, Push и Slack

Novu — open-source инфраструктура уведомлений;
Novu предоставляет унифицированный API, который упрощает отправку уведомлений по нескольким каналам, включая In-App, Push, Email, SMS и Chat. С Novu можно создавать пользовательские рабочие процессы и определять условия для каждого канала, не беспокоясь, что уведомления будут доставлены наиболее эффективным способом.

🖥 GitHub
🟡 Доки

@data_analysis_ml

Читать полностью…
Subscribe to a channel