⚡️ Redka (Red is re-implemented with SQLite)
Выпущена новая версии Redka 1.0. В ней реализованы строки, списки, сеты, хэши, отсортированные сеты, а также управление ключами и транзакциями.
▪Github
@data_analysis_ml
🌟 R для не программистов — открытая книга по анализу данных в R от Daniel Dauber
В этой свободно распространяемой книге описывается использование языка R для большого количество реальных кейсов; изложены важные концепции, с которыми сталкивается аналитик данных в своей работе
📎 Книга
@data_analysis_ml
🔥 Model Explorer — обозреватель моделей от Google
pip install ai-edge-model-explorer
model-explorer
🌟 DVC — open-source инструмент для управления версиями данных и многого другого, что может понадобиться при работе с AI
— brew install dvc
Позволяет управлять данными, используемыми при обучении ML-моделей, такими как изображения, аудио-, видео- и текстовые файлы
Позволяет удобно организовывать воспроизводимые рабочие процессы, связанные с ML.
🖥 GitHub
🟡 Доки
@data_analysis_ml
Совсем скоро стартует самая крупная конференция от Open Data Science-сообщества — Data Fest 2024. Приглашаем вас провести 29 мая в гостях у ВТБ: в программе DS-квиз, лекции от экспертов и нетворкинг 💙
Программа начнётся в 13.30 и продлится до 19.30. Послушаем доклады в рамках всех сессий феста: NLP, MLOps, Scoring и Data Fusion. Для вас выступят эксперты из ВТБ, Т1, Сбера, Ozon Fintech, Lamoda и многие другие! Подробное расписание с докладами можно посмотреть здесь.
А после всех докладов в 20.00 стартуем с DS-квизом – это как классический «Квиз, Плиз!», только с вопросами по ML/DS-тематике. Чтобы принять участие в игре, регистрируй свою команду заранее по этой ссылке (количество мест для участия ограничено, набираем только 18 команд).
Явки и пароли:
❗️Не забудьте зарегистрироваться на мероприятие, вход будет по спискам
📍Москва, Красный Октябрь (Старт Хаб), Берсеневская набережная, 6 стр.3, этаж 5
Не упустите возможность узнать много нового, обменяться опытом и укрепить профессиональные связи! До встречи 29 мая 💙
Реклама. ПАО Банк ВТБ. ИНН 770207013. 0+
Erid: 2Vtzqv1HHyU
Друзья, этой осенью состоится грандиозное событие: Ai Conf 2024 – первая прикладная конференция по Data Science.
Программа будет строиться вокруг областей применения машинного обучения, а к выступлению приглашены не только спикеры из отраслей IT, ECommerce, но и реальный сектор.
Основные темы конференции:
- звук, зрение, изображения
- обработка естественного языка
- рекомендательные системы и поиск
- умные механизмы
- оптимизация использования железа и др.
До 15 июня принимаются заявки на доклады. Есть чем поделиться - подайте заявку https://tglink.io/306d5a32d69c.
А 23 мая в 18:00 приглашаем на встречу докладчиков с программным комитетом, где обсудим какие темы будут актуальны на AI Conf. Встреча онлайн, регистрируйтесь на сайте!
Подробности о конфeренции AiConf 👉 https://tglink.io/aa23c3612693
Получите до 76 000 руб. на обучение в сфере ИИ
Выберите подходящее обучение от Университета Иннополис с господдержкой.
Профессия «Архитектор в области ИИ» 👉 Забронировать место
Аналитика данных и машинное обучение 👉 Забронировать место
Профессия «Руководитель проектов в области ИИ» 👉 Забронировать место
+ Удостоверение о повышении квалификации
erid: LjN8Jwcvy
Все о безопасной разработке расскажут на PHDays Fest 2 в Лужниках 23-26 мая. Positive Technologies вместе с сообществом POSIdev подготовили несколько секций с докладами для разработчиков:
🔥 General development
🔥 Development Security
🔥 Platform Engineering
🔥 Data Engineering
🔥 Team Lead
🔥 Python совместно с сообществом Moscow Python
🔥 Dev tools, languages & frameworks
Спикеры из Samokat, Тинькофф, СберМаркет, Yandex Cloud, Kaspersky, Lamoda Tech, Aвито, Positive Technologies и других компаний расскажут про архитектуру распределенных систем, безопасную разработку приложений, алгоритмы, языки и инструменты разработки, управление командой и не только.
В перерывах можно будет поиграть в IT-крокодила, решить безопасный кроссворд, выиграть полезную книгу или просто отдохнуть в лаунж-зоне. А в субботу, 25 мая, участвуйте в воркшопах экспертов из Positive Technologies, Yandex Cloud и Hilbert Team, Wildberries или в олимпиаде по программированию.
👉 Программа
👉 Регистрация
Академия Аналитиков Авито открывает новый набор.
Учись у практиков. Решай задачи бигтеха.
Прокачайся как аналитик данных или DS-инженер.
Такая строчка в резюме = буст к карьере.
➡️API и начинающий системный аналитик — разбираем все по полочкам
Хотите стать востребованным системным аналитиком и находитесь в начале пути? Приходите на открытый практический урок от OTUS и узнайте:
- что представляет собой проектирование API для аналитика;
- как увидеть, что API нужен;- с чего начать и где искать требования;
- что нужно собрать для проектирования API.
Научимся по шагам проектировать и описывать интеграцию, чтобы ставить разработчикам понятные задачи!
Спикер — ведущий системный аналитик, сертифицированный менеджер и опытный преподаватель.
Встречаемся 20 мая в 19:00 мск в рамках курса «Специализация системный аналитик». Все участники вебинара получат специальную цену на обучение и персональную консультацию от менеджеров OTUS!
🔜Регистрируйтесь прямо сейчас, чтобы не пропустить бесплатный урок и получить специальную скидку на обучение: https://otus.pw/Vk7h/
Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963. erid: LjN8KRAso
Хотите попробовать себя в роли аналитика и попрактиковаться на реальных задачах?
Приходите на бесплатный курс-симулятор Нетологии и Yandex Cloud «Основы анализа данных в SQL, Python, Power BI, DataLens».
В этой профессии много разных направлений — аналитик данных, BI-аналитик, продуктовый аналитик, Data Scientist. Но везде пригодится навык работы с инструментами-помощниками, которые вы и освоите на курсе.
Эксперты-практики расскажут, как делать простые отчёты, исследовать данные и строить интерактивные дашборды. А чтобы понять, что анализ данных — это точно ваше, вместе решите практические задачи из реальных кейсов.
Воспользуйтесь шансом попробовать новые инструменты и запишитесь на бесплатный курс Нетологии.
Регистрация: https://netolo.gy/c9KL
Реклама. ООО "Нетология" LatgBc6EZ
Эффективный метод быстрого освоения ChatGPT.
Обучение нейронной сети и создание правильных промптов – это длительный процесс, который требует значительного времени.
Здесь разработан краткий курс из 5 уроков по ChatGPT. После его завершения вы сможете создать 9 нейронных сетей, которые помогут вам:
- находить ошибки и оптимизировать код
- генерировать посты в Телеграме
- создавать заголовки для рекламы
- делегировать рутинные задачи нейронке
Вы также сможете разработать своих собственных нейро-помощников для продаж, маркетинга и других целей.
Бесплатный доступ предоставляется сразу после регистрации.
Реклама. ООО "ТЕРРА ЭЙАЙ". ИНН 9728019395. erid: LjN8JvcZb
Не представляете свою жизнь без математики и хотите применять её в работе над IT-проектами?
Научиться этому помогут короткие образовательные программы от экспертов-практиков. Плюсы таких форматов — большой объём полезной информации в короткий срок, фокус на узкие дисциплины, новые проекты в портфолио, а также активный нетворкинг и обмен идеями.
Где найти такие программы? Например, у Яндекс Образования. В июле у них стартует студкемп по математике в ИИ на базе Иннополиса. За две недели вы погрузитесь в актуальные вопросы машинного обучения и больше узнаете о математических методах в искусственном интеллекте.
На бесплатной программе ждут студентов старших курсов, обучающихся по направлению Computer Science. Подать заявку можно до 26 мая. Всем, кто успешно пройдёт отбор, организаторы оплатят дорогу и проживание. Переходите на сайт прямо сейчас и заполняйте анкету! Поторопитесь, количество мест ограничено.
Игнорирование больших данных и нейросетей сегодня — почти гарантия провала. Именно поэтому стоит начать погружение в востребованную сферу Data Science и понять, чем занимаются специалисты по машинному обучению и анализу данных. За 5 дней вы узнаете, как работают нейросети, и создадите свою для поиска новостей.
📌 Зарегистрируйтесь прямо сейчас и получите эксклюзивный бонус — гайд «Как пользоваться ChatGPT и Midjourney + 25 полезных нейросетей»: https://epic.st/aP_hhJ?erid=2VtzqvfoxFK
Что будем делать на мини-курсе:
— Узнаем, где востребована наука о данных, и разберёмся в различиях 3 основных направлений
— Освоим азы языка Python и визуализируем данные с его помощью
— Изучим базовые конструкции языка SQL
🎁 Вас ждут подарки:
— Год бесплатного изучения английского языка
— Персональная карьерная консультация
— 5 полезных чек-листов для старта карьеры
🎉 Все участники мини-курса получат сертификат на скидку 10 000 рублей на любой курс Skillbox.
Реклама. ЧОУ ДПО «Образовательные технологии «Скилбокс (Коробка навыков)», ИНН: 9704088880
Вас заменит не искусственный интеллект, а те, кто будет работать с ним.
Не дайте таким специалистам шанс отобрать у вас место в компании мечты — записывайтесь на бесплатный онлайн-практикум «Как не потерять работу из-за ИИ: погружаемся в аналитику и Data Science».
За 2 дня вы:
- узнаете, чем занимаются аналитик данных и Data Scientist
- попробуете эти профессии на практике
-определите, какое направление вам больше подходит
- наметите карьерный план и заберете подарки
Зарегистрироваться бесплатно: https://go.skillfactory.ru/&erid=2VtzqvUpTXF
Реклама ООО "Скилфэктори", ИНН 9702009530
Онлайн-день AvitoTech на Data Fest | 26 мая с 13:00 до 18:00
В программе:
• Общение с рекрутерами и лидами Авито в Spatial Chat;
• Участие в ML System Design Game с Михаилом Каменщиковым, руководителем команды рекомендаций в Авито.
Воркшоп поможет получить опыт работы над крупными проектами и подготовиться к собеседованиям, а также развивать свои идеи в интерактивном формате. Регистрация на онлайн и офлайн-активности по ссылкам.
И помните, 1 июня ожидается большой офлайн-день в московском офисе Авито. Подробности программы здесь.
Стать сотрудником Яндекса быстрее и проще, чем кажется. Участвуйте в днях быстрого найма: решите тестовое, пройдите несколько секций собеседования и получите офер за несколько дней.
Ближайшее Fast Track мероприятия:
• 8–9 июня — для дата-инженеров, офер за 2 дня в DWH команды Маркета.
Зарегистрироваться
🔥Подборка лучших обучающих каналов для программистов.
➡️ Делитесь с коллегами и сохраняйте себе, чтобы не потерять
⚡Машинное обучение
Machine Learning - запускаем лучшие ИИ модели, пишем код, погружаемся в нейросети
Ml Собеседование - подготовка к собесу по мл, алгоритмам, коду
Ml ru - актуальные статьи, новости, код и обучающие материалы
Ml Jobs - вакансии ML
ML Книги - актуальные бесплатные книги МО
ML чат
🏆 Golang
Golang
Golang собеседование - разбор задач и вопросов с собесов
Golang вакансии -работа для Go разработчика
Golang книги библиотека книг
Golang задачи и тесты
Golang чат
Golang news - новости из мира go
Golang дайджест
💥 Linux /Этичный хакинг
Linux Academy - гайды, секреты и лучшие материалы по Linux
Kali linux - погрузись в мир этичного хакинга и кибербезопасности
linux_kal - kali чат
Информационная безопасность
🚀 Data Science
Анализ данных - полезные фишки, код, гайды и советы, маст-хэв датасаентиста
Data Jobs - ds вакансии
Аналитик данных
Data Science книги - актуальные бесплатные книги
Big data
🛢Базы данных
Sql базы данных - научим работе с базами данных профессионально
Библиотека баз данных
SQL чат
Вакансии Sql аналитик данных
#️⃣C#
С# академия - лучший канал по c#
С# заметки — код, лучшие практики, заметки программиста c#
С# задачи и тесты
С# библиотека - актуальные бесплатные книги
C# вакансии - работа
🐍 Python
Python/django - самый крупный обучающий канал по Python
Python Собеседование - подготовка к собеседовению python и разбор алгоритмов
Pro python - статьи, новости, код и обучающие материалы
Python Jobs - вакансии Python
Python чат
Python книги
☕ Java
Java академия - java от Senior разработчика
Java вакансии
Java чат
Java вопросы с собеседований
Java книги
💻 C++
C++ академия
С++ книги
C++ задачи - подготовка к собеседовению мл, алгоритмам
C++ вакансии
⚡️ Frontend
Javascript академия - крупнейший js канал
React - лучшие гайды и советы по работе с react
Frontend - тутрориалы, уроки, гайды, код
PHP
Книги frontend
Задачи frontend
🦀 Rust
Rust программирование
Rust чат
Rust книги для программистов
📲 Мобильная разработка
Android разработка
Мобильный разработчик гайды и уроки
🇬🇧 Английский для программистов
🧠 Искусственный интеллект
ИИ и технологии
Neural - нейросети для работы и жизни
Книги ИИ
Artificial Intelligence
🔥 DevOPs
Devops для программистов
Книги Devops
🌟 Docker/Kubernets
Docker
Kubernets
📓 Книги
Библиотеки Книг для программситов
💼 Папка с вакансиями:
Папка Go разработчика:
Папка Python разработчика:
Папка Data Science
Папка Java разработчика
Папка C#
Папка Frontend
💥 Бесплатный Chatgpt бот
⚡️ Большая шпаргалка-учебник по ML
Здесь и основная теория по Machine Learning, и примеры реализации конкретных ML-алгоритмов — в общем, самое то, чтобы освежить базу перед собеседованием
📎 Шпаргалка
@data_analysis_ml
⚡️ Google представили CAT3D: Инструмент для 3D генераций, с помощью диффузионных моделей
Создавайте 3D-сцены из любого количества реальных или сгенерированных изображений
proj: https://cat3d.github.io
abs: https://arxiv.org/abs/2405.10314
@data_analysis_ml
🌟 GPT-4o доступна в предварительной версии службы Microsoft Azure
Новейшая модель ChatGPT-4o от OpenAI теперь доступна в предварительной версии службы Microsoft Azure.
Microsoft заявила, что клиенты службы могут изучить обширные возможности GPT-4o с помощью песочницы в Azure OpenAI Studio. Она частично доступна в США. В первом выпуске основное внимание уделяется вводу текста и изображений.
🟡 Подробнее
▶️ Azure AI Studio
@data_analysis_ml
🌟 ydata-profiling — быстрое создание отчётов на основе данных
— pip install ydata-profiling
ydata-profiling — это библиотека Python для профилирования данных, которая автоматизирует и стандартизирует создание подробных отчетов, дополненных статистикой и визуализацией.
Фишка ydata-profiling в том, что она позволяет подготовить данные к анализу всего 1 строкой кода
Использование ydata-profiling может выглядеть так:
import pandas as pd
from ydata_profiling import ProfileReport
df = pd.read_csv('data.csv')
profile = ProfileReport(df, title="Profiling Report")
🔥 PyTorch реализация GPTs с использованием нейросетей Колмогорова-Арнольда (KAN)
Чуть больше недели прошло с анонса нейросети принципиально новой архитектуры (Kolmogorov-Arnold Network), и вот уже первые первые реализации на PyTorch, встречайте
— pip install kan_gpt
🖥 GitHub
@data_analysis_ml
🌟 Пошаговая реализация архитектуры Transformer
В этом ноутбуке максимально подробно описан каждый шаг реализации трансформера с нуля, с необходимым теоретическим минимумом
Для полного просветления можно скомбинировать с видео 3blue1brown">3b1b
▶️ Jupyter Notebook
@data_analysis_ml
🖥 Phidata — фреймворк для добавления памяти, знаний и новых опций к LLM
— pip install -U phidata
А вот пара примеров AI-веб-приложений, созданных с помощью Phidata:
🟡 PDF AI — обобщает и отвечает на вопросы из PDF-файлов
🟡 ArXiv AI — отвечает на вопросы о статьях ArXiv, используя ArXiv API
🟡 HackerNews AI — обобщает истории, пользователей и делится тем, что нового на HackerNews
🖥 GitHub
🟡 Доки
@data_analysis_ml
💻 DrawDB — open-source интуитивно понятный онлайн-инструмент для проектирования БД и генерации SQL-запросов
DrawDB — это удобный онлайн-редактор отношений между базами данных и сущностями (DBER).
Позволяет создавать диаграммы в несколько кликов, экспортировать sql-скрипты, настраивать редактор и многое другое без создания учетной записи. Ознакомиться с полным набором функций можно здесь.
Для локального использования:
git clone https://github.com/drawdb-io/drawdb
cd drawdb
npm install
npm run dev
⚡️ Red Hat объявила о выпуске дистрибутива RHEL AI для ML-разработчиков
Red Hat выпустила дистрибутив Red Hat Enterprise Linux AI (RHEL AI), который создали специально для ML-разработчиков. В сборку включены инструменты и фреймворки для работы с моделями машинного обучения.
▶️ Подробнее
@data_analysis_ml
⚡️ xLSTM: расширенная долгая краткосрочная память
С тех пор как LSTM возникли и выдержали испытание временем, они способствовали многочисленным успехам глубокого обучения, в частности, привели к созданию LLM.
Однако появление технологии Transformer с распараллеливаемым самовниманием в основе ознаменовало рассвет новой эры, превзойдя LSTM по масштабу.
Возникают вопросы: как далеко мы можем продвинуться в языковом моделировании при масштабировании LSTM до миллиардов параметров, используя новейшие методы современных LLM, но смягчая известные ограничения LSTM?
• 1 — можно использовать экспоненциальный гейтинг с соответствующими методами нормализации и стабилизации.
• 2 — можно модифицировать структуру памяти LSTM, получая: (I) sLSTM со скалярной памятью, скалярным обновлением и новым смешиванием памяти; (II) полностью распараллеливаемую mLSTM с матричной памятью и правилом обновления ковариации.
Так и возникает xLSTM — расширенная долгая краткосрочная память.
Экспоненциальный гейтинг и модифицированные структуры памяти повышают возможности xLSTM и позволяют сравнить их с современными трансформерами как по производительности, так и по масштабированию.
Держите совсем свежую статью с описанием xLSTM
📎 Arxiv
@data_analysis_ml
🌟 Novu — IaaC инфраструктура уведомлений на основе GitOps. Встроенный центр уведомлений, интеграция с электронной почтой, Push и Slack
Novu — open-source инфраструктура уведомлений;
Novu предоставляет унифицированный API, который упрощает отправку уведомлений по нескольким каналам, включая In-App, Push, Email, SMS и Chat. С Novu можно создавать пользовательские рабочие процессы и определять условия для каждого канала, не беспокоясь, что уведомления будут доставлены наиболее эффективным способом.
🖥 GitHub
🟡 Доки
@data_analysis_ml