ds_wiki | Unsorted

Telegram-канал ds_wiki - DATApedia | Data science

3571

Тут вы найдете всё, что связано с Data Science, AI и Machine Learning, как для начинающих, так и для бывалых специалистов. Также, для вас, мы переводим зарубежные статьи. Сотрудничество: @Seyfme

Subscribe to a channel

DATApedia | Data science

​​DWH как продукт: платформа, инструменты, масштабирование команды

В статье рассказано, как продуктовый взгляд помогает развивать DWH и быть полезнее для пользователей. Речь пойдёт про появление платформенных инструментов и рост проникновения аналитики в компании, а также про реорганизацию команды и перераспределение задач. Будет больше о процессах и практиках, чем о хардкорных технологиях. Но и технологии немного затронуты.

Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

​​Новые инструменты для работы c ML-моделями и обзор MLOps от CERN

В новом дайджесте для вас много интересных обзоров по инструментам — как говорится, ни ClearML и Airflow едиными. Рынок решений стремительно развивается, и эта подборка поможет вам держать руку на пульсе.

Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

​​Особенности прогнозирования продаж и оттока в условиях неопределенности

В этом посте автор опишет свой опыт построения модели прогнозирования продаж конвергентных продуктов (2019-2021), а также прогнозирования оттока мобильных абонентов в 2022 году. Расскажет, как работала модель в относительно стабильный период до 2020-го года, и какие корректировки пришлось внести впоследствии.

Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

Курс «Английский для аналитиков» Яндекс Практикума

Для специалистов, которые хотят изменить свою профессиональную жизнь и работать в международной команде.
Обучение построено вокруг рабочих ситуаций и полезных для карьеры навыков:

🗣 Самопрезентация. Рассказ о своей роли, задачах, сфере ответственности на поведенческом интервью и в неформальной беседе.
🙌 Работа в команде. Стендапы, планирование спринтов, демонстрация навыков командной работы на собеседовании.
👨‍💻 Общение с заказчиками и исполнителями. Сбор требований у стейкхолдеров и постановка задач для разработчиков.
📈 Презентация результатов работы. Выступление на митапах, неформальное общение с коллегами из отрасли.
📝 Обсуждение решений по проекту. Генерация и аргументация идей, участие в мозговых штурмах.
🚀 Рефлексия и самоанализ. Ретроспектива, ревью, ответы на сложные вопросы.

Запишитесь на бесплатную консультацию. Кураторы определят ваш уровень языка и расскажут подробнее про обучение.

Читать полностью…

DATApedia | Data science

​​Тварь дрожащая или право имею: как мы лепили виртуального юриста из русскоязычных нейросетей

В статье рассказывается об опыте обучения русскоязычных и зарубежных моделей нейросетей российскому законодательству.

Перейти к статье | DATApedia | #DS_AI

Читать полностью…

DATApedia | Data science

​​Откуда Карты знают, когда приедет автобус

В этой статье рассказывается что у «Транспорта» под капотом, какие алгоритмы отвечают за то, чтобы автобусы появлялись на карте, двигались по ней плавно и реалистично, а прогноз был максимально точным.

Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

​​Как мы разрабатывали алгоритм для анализа уникальных посетителей

В этой статье рассказано о решении для анализа уникальных посетителей. Описаны недостатки существующих на рынке решений и рассказано, почему надо остановиться именно на видеоаналитике

Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

Пользователи ChatGPT начали получать доступ к новому плагину

Речь про Code Interpreter — модель, которая может обрабатывать большие объемы данных, используя Python. В том числе обрабатывать загружаемые файлы.

Говорят, что это как очень крутой аналитик. Вот часть из того, что научились делать пользователи с помощью плагина:

- Сегментировать данные;
- Выстраивать прогноз на основе данных (линейная регрессия);
- Создавать географические карты объектов;
- Визуализировать данные в диаграммах и графиках;
- Делать запросы на естественном языке;
- Редактировать и удалять большие объемы данных.

DATApedia

Читать полностью…

DATApedia | Data science

Алоха, коллеги! Запускаем рубрику #fromInterviewWithLove!

Сегодня будет дана задача по SQL для начинающих специалистов.

Задача: В базе данных хранятся данные о продажах продуктов в разных магазинах. Необходимо вывести список магазинов, в которых были проданы все виды товаров. Таблица sales содержит следующие поля:
- id - уникальный идентификатор продажи;
- store - название магазина;
- product - название продукта.


Решение SQL запросом:
SELECT store
FROM sales
GROUP BY store
HAVING COUNT(DISTINCT product) = (SELECT COUNT(DISTINCT product) FROM sales);

Данный запрос группирует данные по названию магазина и находит количество уникальных продуктов, проданных в каждом магазине. Затем он сравнивает это количество с общим числом уникальных продуктов в таблице sales. Если количество уникальных продуктов в магазине равно общему количеству уникальных продуктов в таблице, значит все продукты были проданы в данном магазине. Результат запроса - список магазинов, в которых были проданы все виды товаров.


SQLpedia

Читать полностью…

DATApedia | Data science

Прямо сейчас идёт набор в ШАД — двухгодичную программу Академии Яндекса для тех, кто хочет исследовать Machine Learning и работать в IT-индустрии.

Обучение проходит по 4 направлениям:
— data science
— инфраструктура больших данных
— разработка машинного обучения
— анализ данных в прикладных науках

Для опытных разработчиков и ML-исследователей есть альтернативный трек поступления.

Программа ШАДа полностью бесплатна. Учиться можно дистанционно или офлайн — в одном из 6 филиалов. Скорее переходите по ссылке и заполняйте анкету участника: https://clck.ru/34EePB

Читать полностью…

DATApedia | Data science

​​Если вы ищите канал для ИТ-аналитиков, то вам несомненно подойдет - Analyst IT. На канале ежедневно выходят полезные материалы для аналитиков, разбор скилов разных ИТ-аналитиков (бизнес-аналитиков, системных аналитиков, аналитиков данных и др), также есть авторский контент, который поможет вам с разбором рабочих процессов, ну и вообще погрузиться в сферу анализа!

На канале есть разные рубрики:
- про проф литературу (например книга по Python)
- про разбор скилов аналитиков
- про сервисы, которыми пользуются аналитики (например Notion) и др.

Если интересно заходите в гости)))

Подписаться 👉🏻 @analysis_it

Читать полностью…

DATApedia | Data science

​​EasyPortrait — портретная сегментация и анализ лиц

В данной статье рассказывается о новом наборе данных EasyPortrait, описан процесс его создания от идеи до разметки, и представлены обученные на нем нейронные сети.

Перейти к статье | DATApedia | #DS_AI

Читать полностью…

DATApedia | Data science

DataHub: как делиться структурированными данными и получать за них донаты?

В этой статье основатель платформы DataHub рассказывает о том, как создать FREE и SPONSORED репозитории данных, а так же в чем их отличия.

Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

Пять примеров успешного использования ИИ на производстве

Источник | #DS_AI

Читать полностью…

DATApedia | Data science

Локальные нейросети (генерация картинок, локальный chatGPT). Запуск Stable Diffusion на AMD видеокартах

Источник | #DS_AI

Читать полностью…

DATApedia | Data science

​​Что нам стоит диаграмму в Python построить: 5 вариантов привлекающей внимание визуализации данных и кое-что ещё

Диаграммы помогают визуализировать как простые, так и самые сложные наборы данных. При этом диаграмм — множество видов, у каждого есть свои достоинства и недостатки. О наиболее эффектных и эффективных, реализуемых с Python, рассказывается в сегодняшней подборке.

Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

​​Slovo и русский жестовый язык

В этой статье рассказывается о непростой задаче распознавания русского жестового языка (РЖЯ) для слабослышащих. Также затронуты основные особенности РЖЯ, и проблемы и сложности самого языка, и процесс его сбора и разметки.

Перейти к статье | DATApedia | #DS_AI

Читать полностью…

DATApedia | Data science

​​Бустим топ: внедрение ML в ранжирование каталога

В этой статье расскажут, почему задача ранжирования каталога важна для бизнеса, как была построена систему ранжирования каталога на основе ML и переход на нее с эвристик.

Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

​​Как построить систему геоаналитики с применением ML

В этой статье рассмотриавются примеры работы сервисов геоаналитики VK Predict. Выясняется, какие модели машинного обучения используются при построении таких систем и из каких этапов состоит разработка продукта с возможностями геоаналитики.

Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

​​PromptGPT: оптимизируем промт для GPT-4

Автор статьи написал небольшой тул, который измеряет качество модели на различных промтах и позволяет выбрать оптимальный. В этой статье автор сначала расскажет как этот тул работает, а потом покажет процесс оптимизации промта

Перейти к статье | DATApedia | #DS_AI

Читать полностью…

DATApedia | Data science

​​Как структурировать проекты машинного обучения с помощью GitHub и VS Code: полная инструкция с настройками и шаблонами

Статья о том, как организовать файлы в проектах машинного обучения, используя VS Code.

Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

Массивный курс по управлению данными и обзор новинок от NVIDIA. Дайджест полезных текстов про ML и дата-аналитику

В этой статье — смесь фундаментальных трудов и более «популярных» статей на тему ML, искусственного интеллекта и дата-аналитики. Думаю каждый найдет здесь для себя что-то интересное.

Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

Любой важный созвон на удаленке проходит именно так

Читать полностью…

DATApedia | Data science

​​Лучшие ИИ-инструменты для аннотирования видео в 2023 году

В статье рассматриваются некоторые из лучших инструментов аннотирования видео на основе ИИ.

Перейти к статье | DATApedia | #DS_AI

Читать полностью…

DATApedia | Data science

Самостоятельное обучение стало проще с Notion AI. Онлайн школы скоро вымрут? Пример SQL курса

В этой статье показано на простом примере как новичку в IT сфере упростить себе путь осваивания хард скиллов и не платить онлайн школам много денег.

Перейти к статье | DATApedia | #DS_AI

Читать полностью…

DATApedia | Data science

​​DataHub: веб-песочница для тех, кто изучает SQL

В этой статье показывается на что способен веб-редактор MySQL хранилища и почему это отличный инструмент для работы тем, кто изучает SQL.

Перейти к статье | DATApedia

Читать полностью…

DATApedia | Data science

Алгоритм, сделавший ChatGPT таким «человечным» — Reinforcement Learning from Human Feedback

ChatGPT генерирует разнообразный и привлекательный для человека текст. Но что делает текст «хорошим»? В этой статье разобран алгоритм, который позволяет согласовать модель машинного обучения со сложными человеческими ценностями.

Перейти к статье | DATApedia | #DS_AI

Читать полностью…

DATApedia | Data science

5 вещей о наблюдаемости данных, которые должен знать каждый дата-инженер

Источник

Читать полностью…

DATApedia | Data science

Эволюция прогноза времени в Delivery Club

Источник

Читать полностью…

DATApedia | Data science

Когда кормишь ПМа завтраками

Читать полностью…
Subscribe to a channel