datalytx | Unsorted

Telegram-канал datalytx - Datalytics

9020

Канал для аналитиков данных про Python, карьерное развитие в анализе данных, всякое разное Автор – @ax_makarov Отдельный канал про ChatGPT и его практическое применение —  @ai_forge Чат канала — @pydata_chat Вакансии — @data_hr

Subscribe to a channel

Datalytics

От создателей Академии Аналитиков Авито — открытый курс по прикладной статистике.
Бесплатно, без регистрации и смс.

Для тех, кто хочет научиться:
– применять критерии Манна-Уитни, t-test, бутстрап, хи-квадрат;
– использовать специализированные библиотеки Python;
– разрешать спорные ситуации при анализе данных.
– экспериментировать, выводить критерии, доказывать формулы.

Уроки построены на примере реальных данных и показывают, как решаются задачи бизнеса с применением прикладной статистики. Рекомендуем.

Читать полностью…

Datalytics

Хотите использовать машинное обучение в бизнес-целях?

На бесплатной конференции «OTUS CONF: Machine Learning» мы поговорим о трёх важных элементах машинного обучения. Обсудим генеративные модели нейросетей, модели обработки естественного языка и обработку временных рядов.

На конференции выступят дата-сайентисты из крупных компаний: кандидаты технических, физико-математических и экономических наук.

Вы узнаете:
▫️Как современные генеративные модели применяют в бизнесе, и что «под капотом» нейросетей типа GPT
▫️С какими ошибками вы можете столкнуться при обработке временных рядов и какие решения применять
▫️Как бизнесу применять NLP-модели семейства BERT
▫️Как собирать данные, чтобы дообучить NLP-модели

Бонус для участников! Скидка 7% на любой курс OTUS

Конференция состоится 24 апреля в 19:00 МСК
Участие бесплатное


Записаться на событие

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576

Читать полностью…

Datalytics

📊 Хотите углубиться в Machine Learning или Data Science?

Начните с изучения базовых методов парсинга и работы с html! Приходите на бесплатный практический урок от OTUS. Спикер Мария Тихонова — PhD Computer Science, Senior Data Scientist в SberDevices и преподаватель ВШЭ.

💻 На вебинаре вы:

— освоите основные принципы работы c html в Python;
— изучите основные инструменты парсинга;
— научитесь скачивать различные типы данных с сайтов на сайты.

👉 Встречаемся 22 апреля в 18:00 мск в рамках курса «Machine Learning. Professional». Все участники вебинара получат специальную цену на обучение и консультацию от менеджеров OTUS!

🟢 Пройдите короткий тест прямо сейчас, чтобы посетить бесплатный урок: https://clck.ru/3A936k

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru

Читать полностью…

Datalytics

18 апреля в 18:00 мск приглашаем на День открытых дверей онлайн-магистратур по аналитике данных.

Представители Практикума, РАНХиГС и ТГУ расскажут о трёх программах, на которые открыт набор в 2024:

Дата-аналитика для бизнеса
Финансовый анализ в бизнесе
Data Science в экономике (трек 1 или 2 года)

Вы узнаете, что нужно для поступления, как проходит учёба и какие льготы получают студенты онлайн-программ.

Участие бесплатное, но нужно зарегистрироваться.

Реклама. ООО «Яндекс». ИНН 7736207543

Читать полностью…

Datalytics

Появились записи с A/B platform meetup от команды СберМаркета

🟡Система автоматического расчёта А/В тестов. Рамиль Чермантеев, руководитель команды аналитиков-инженеров платформы экспериментов СберМаркета, рассказал, что автоматический расчет из себя представляет и с какими трудностями ребята столкнулись при его развитии.

🔴Как привести эффекты от A/B-экспериментов к масштабу всей компании? Артем Дронов, аналитик АВ-платформы, Авито, поделился методологией приведения и оценки результатов экспериментов к масштабу всей компании.

🔵Система офлайн-экспериментов. Полина Ревина, и.о. руководителя A/B-платформы в СберМаркете, рассказала о свитчбэк-тестах и тестах в магазинах, сплитование для которых делается офлайн.

🟡Open Talks: Как развивать и масштабировать платформы и процесс проведения экспериментов. Модератор дискуссии со спикерами – Искандер Мирмахмадов, co-founder EXPF.

Читать полностью…

Datalytics

Читаю я тут пост "Build Lines, Not Dots". Ключевая мысль там о том, что доверие инвесторов по отношению к стартапу сильно зависит от восприятия инвесторами последовательного роста и ощущения динамики, сдобренной грамотным принятием решений

То есть по сути надо создать картинку, что мы а) растим метрики б) этот рост обсуловлен нашим целеполаганием и действиями

А значит стартапер должен на любой стадии отношений уметь создавать сторилайн, который отображает ключевые точки роста компании, связывая их в линии. И вот это «связывание в линии» — важное качество не только для фаундеров, но и для аналитиков

👨‍🏫 Можно заменить «инвестора» на «стейкхолдера». То есть любую персону, которой вы презентуете результат аналитики (продакт, CPO, CEO, руководитель аналитики). Представляя информацию стейкхолдерам, аналитики должны фокусироваться не на единичных "точках", а выстраивать "линии". Каждая встреча, каждый инсайт - это точка. Но объединяя их в линию, мы показываем динамику, изменения, тренды. 📈

🤝 Инвесторы формируют доверие, когда видят последовательный прогресс, а не разрозненные факты. Так и аналитик должен стремиться выстроить доверие у заказчика, демонстрируя связь между инсайтами, показывая движение к некоторой цели.

💡 Но инсайты - это еще не все. Важно давать actionable recommendations: что конкретно нужно сделать, основываясь на данных и анализе? Какие шаги предпринять? Так решения будут приниматься быстрее.

🌉 Между аналитиком и стейкхолдером должен выстраиваться "мост" доверия и взаимопонимания. Через последовательные качественные инсайты, через регулярное общение, через понимание и удержание в картинке аналитика целей бизнеса. 🤝

🧘‍♂️ Быть аналитиком - это искусство балансировать между наукой и творчеством, объективностью и эмпатией, деталями и большой картиной. Совмещая эти роли, мы становимся по-настоящему ценными для бизнеса.

Вот такой путь от точек - к линиям, от разрозненных фактов - к пониманию и действиям. Каждый аналитик способен пройти его - было бы желание! 😉

Читать полностью…

Datalytics

🤖 AI и SQL: союзники или конкуренты в аналитике данных? 📊

Оригинал: https://benn.substack.com/p/llms-shouldnt-write-sql от Benn Stancil

Benn рассуждает о роли AI в аналитике и его взаимодействии с SQL. Ключевой вопрос - смогут ли LLM полноценно заменить SQL в качестве основного интерфейса для запросов к данным? 🤔

Автор выделяет 2 типа анализа данных:
1️⃣ "Пользовательский" - когда уже известны метрики, KPI, есть структура виджетов и дашбордов. Тут уже сейчас используются BI-tools типа drag-n-drop с SQL "под капотом"
2️⃣ "Исследовательский" - разработка новых метрик и сложных ad-hoc запросов аналитиками в SQL/Python. Со сложными join и оконными функциями, часто не поверх витрин, а на базе raw data

Перспективы применения AI в первом типе:
✅ NLP-интерфейс для BI-tools, "переводящий" вопросы на естественном языке в SQL-запросы через data model.
❌ А вот прямая генерация SQL по вопросу без data model чревата ошибками и галлюцинациями.

Второй тип анализа требует точности и гибкости SQL, поэтому генерацию полных запросов из описаний на естественном языке Benn считает утопией. 😥

💡 Идеальный сценарий на стыке AI и SQL, по мнению автора - генерация корректных запросов из "псевдокода", где аналитик задает логику на SQL вперемешку с описанием деталей на английском. Тот же принцип, что в генеративном AI для графики - дорисовка по наброску.

👍 Такой гибридный подход позволит аналитикам писать запросы быстрее и абстрагироваться от технических деталей, сохраняя точность. А AI станет "суперсилой" аналитика, а не его заменой.

Вывод: SQL и AI будут не конкурировать, а дополнять друг друга, давая аналитикам новые суперспособности. 🦸‍♂️ Но для полной замены SQL "общением" с AI нужен большой прогресс в алгоритмах и архитектурах.

Читать полностью…

Datalytics

🚀 Освойте мониторинг и управление производительностью в Spark

👉 Приходите на бесплатный практический урок от OTUS, где вы вместе с опытным экспертом разберете:

— какие ключевые показатели производительности (KPIs) следует отслеживать для приложений Spark;

— подходы и практики для настройки мониторинга в реальном времени в кластерах Spark;

— инструменты и платформы для мониторинга и логирования;

— стратегии для сбора, анализа и визуализации метрик и логов в приложениях Spark.

💻 Встречаемся 18 апреля в 20:00 мск в рамках курса «Spark Developer». Доступна рассрочка на обучение!

🔥 Пройдите короткий тест прямо сейчас, чтобы посетить бесплатный урок и получить запись: https://clck.ru/3A34FW

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru

Читать полностью…

Datalytics

Подборка каналов для поиска удаленной работы в сфере IT 🌐

Все мы сталкиваемся с досадной ситуацией, когда после многочисленных откликов на вакансию ответ так и не приходит. Хочется откликаться только на проверенные вакансии у надежных работодателей, а не фильтровать вакансии на сайтах по поиску работы? Именно для вас мы предлагаем подборку каналов в телеграме для поиска работы в IT.

В папке также есть каналы в которых есть рекомендации по поиску работы, прохождению собеседований и анализу рынка труда!

Подпишись на все интересующие каналы и получи возможность первым откликнуться на самые привлекательные вакансии в сфере IT.

➡️ Ссылка на папку

Успехов в поиске работы!

Читать полностью…

Datalytics

Освойте продвинутые методы агрегации данных в ClickHouse!

Приходите на бесплатный практический урок от OTUS, где вы вместе с опытным экспертом разберете:

1. методы агрегации данных в ClickHouse;
2. типы агрегатных функций;
3. комбинаторы к агрегатным функциям;
4. состояния и настройки для агрегации.

Вебинар поможет вам:

1) получить инструментарий для построения продвинутых запросов и покрытия нужд аналитики;
2) переложить работу по агрегации сырых данных с приложения на БД.

Встречаемся 11 апреля в 20:00 мск в рамках курса «ClickHouse для инженеров и архитекторов БД». Доступна рассрочка на обучение!

➡️ Регистрируйтесь прямо сейчас, чтобы посетить бесплатный урок и получить запись: регистрация

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576

Читать полностью…

Datalytics

🌐 Интересуетесь автономной навигацией и компьютерным зрением?

Приходите на бесплатный практический урок «SLAM и архитектуры моделей компьютерного зрения в автономных транспортных средствах» от OTUS.

💻 На вебинары вы получите:

— понимание основных принципов SLAM и его роли в автономных системах;
— знание основных архитектур компьютерного зрения для задач навигации;
— ответы на все свои вопросы в режиме реального времени.

Встречаемся 15 апреля в 20:00 мск в рамках курса «Компьютерное зрение». Доступна рассрочка на обучение!

👉 Пройдите короткий тест прямо сейчас, чтобы посетить бесплатный урок и получить запись: https://clck.ru/39xkSY

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru

Читать полностью…

Datalytics

🚀 Альфа-Банк приглашает системных аналитиков на One Day Offer. 13 апреля пройдите все этапы собеседования и получите оффер за один день.

Принять участие: https://cnrlink.com/alfaododatalytx

Альфа-Банк ищет специалистов, которые возьмут на себя разработку архитектуры взаимодействия внутренних учётных систем банка. На первом этапе – обучение и погружение, затем – постепенное усложнение задач.

Ожидания от кандидатов:
1️⃣ Опыт работы системным аналитиком от 2 лет.
2️⃣ Умение писать базовые SQL-запросы.
3️⃣ Понимание принципов межсистемной интеграции.
4️⃣ Опыт написания документации и описания функциональности.

Формат работы – на выбор: полная удалёнка, гибрид или офис в Москве, Санкт-Петербурге или Екатеринбурге с гибким графиком.

⏰ One Day Offer Альфа-Банка пройдёт в онлайн-формате 13 апреля. Успейте подать заявку до 11 апреля, чтобы принять участие в мини-игре с призами и получить приглашение на собеседование: https://cnrlink.com/alfaododatalytx

Реклама. АО "АЛЬФА-БАНК". ИНН 7728168971. erid: LjN8KEkBf

Читать полностью…

Datalytics

Проложили маршрут по самым популярным профессиям в анализе данных. Узнайте, какая из них подойдёт вам — это бесплатно.

В путь

Читать полностью…

Datalytics

⁉️ Интересуетесь сферой Computer Vision? Разберите одну из важных тем на практике

Приходите на бесплатный практический урок «Современные self-supervised подходы в computer vision: решаем задачи без обучения моделей» Otus, лекцию читает Борис Цейтлин — опытный CV-эксперт.

Segment Anything, DINO и другие foundational модели меняют ландшафт Computer Vision. На этом занятии вы узнаете, как ими пользоваться, в каких случаях можно вообще не обучать модели, а когда все-таки придется.

🔜 Встречаемся 4 апреля в 20:00 мск в рамках курса «Компьютерное зрение». Доступна рассрочка на обучение!

🟢 Пройдите короткий тест прямо сейчас, чтобы посетить бесплатный урок и получить запись: https://clck.ru/39oJYo

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru

Читать полностью…

Datalytics

Avito Analytics Meetup #12

Запись докладов доступна по ссылке 👆

Эксперты из AvitoTech и других крупных компаний разобрали кейсы аналитической поддержки при создании нового продукта, а также рассказали как и зачем анализируют обратную связь о товарах в ритейле и не только.

Темы докладов:
👉 Аналитика нового продукта «под ключ»;
👉 Обратная связь в «Пятёрочке»: как работают с оценками товаров;
⚡️ Секретный доклад.

Читать полностью…

Datalytics

🌐 Как с помощью искусственного интеллекта автоматизировать и упростить поиск работы в ИТ уже сегодня?

Продолжаем серию полезных вебинаров для поиска работы в ИТ. В этот раз мы проведем мастер-класс, на котором покажем все самые полезные возможности использования ChatGPT при поиске работы.

🔎 Наш сегодняшний эксперт, Мария Мамкина, Senior Product Manager с 9-летним международным опытом в IT. Автор Telegram канала (Mamkina_Tech) про продуктовый менеджмент и подготовку к собеседованиям в IT.

На мастер классе вы узнаете как писать качественные промты в ChatGPT, которые помогут вам:

🔵преобразовать обязанности из вашего резюме в достижения
🔵адаптировать резюме под конкретную вакансию
🔵быстро и правильно писать сопроводительные письма под вакансию

Заполняйте анкету по ссылке, чтобы попасть на вебинар!

Встреча пройдет на русском языке во вторник 23 апреля в 20:00 по Ереванскому времени| по Москве в 19:00

Вы также можете заранее подготовить и оставить ваши вопросы под этим постом по теме вебинара. Наш эксперт ознакомится с ними и обязательно ответит вам.

Подписывайтесь на телеграм канал ассоциации, чтобы быть в курсе самых актуальных и полезных материалов по развитию карьеры в ИТ.

Читать полностью…

Datalytics

😎 Публичный Гайд по повышению BI Adoption перевел в более читабельный PDF формат ☝️

Размышлял над темой год и пора упаковать и переключится.

Еще родился шаблон для воркшопа, чтоб самим провести анализ в команде.

Кому эта тема интересна пишите и приходите на курс по BI стратегии в мае.
Там это все обсудится и пошарится

Читать полностью…

Datalytics

Запись стрима «Как проходит собеседование на продуктового аналитика в Авито?»

Вместе с Вовой Камчаткиным, продуктовым аналитиком в компании inDrive, увидите, какие вызовы и задачи ждут вас и как к ним лучше подготовиться

Самое интересное:
Рассказ про опыт и вопросы: SQL, Python, ML, продуктовые кейсы
Пример задачи со сложными аналитическими подходами
Техническая задача про кубик (теорвер)
Продуктовый кейс на примере Telegram
Фидбек Вове по итогам собеседования по матрице компетенций аналитиков Авито

Читать полностью…

Datalytics

🔥 Бесплатный интенсив по Python для начинающих аналитиков!

Завтра в 19:00 по Мск пройдет бесплатный интенсив по теме: “RFM-анализ клиентской базы с помощью Pandas в Python”.

Мы проводили такой интенсив в январе, но многие не успели на него записаться, а очень хотели — поэтому мы решили, почему бы не провести его еще раз 😍
А еще он очень понравился участникам, и мы собрали много положительного фидбека 💫

Что будем делать на интенсиве:

✅ Проанализируем реальную клиентскую базу аптечной сети
✅ Проведем EDA с помощью Pandas
✅ Напишем скрипт для проведения RFM-анализа
✅ Изучим несколько классных фишек Pandas
✅ Сформулируем конкретные бизнес-выводы и предложения на основании проведенного анализа

Мы также расскажем о частых ошибках новичков и поделимся лайфхаками — как достойно пройти собеседование и удивить ревьюера крутыми фишками 🤩

Любой рекрутер, увидев RFM-анализ в вашем портфолио, скажет: «О, круто, мы тоже такое делаем - классно, что кандидат это уже умеет!». И ваши шансы найти работу аналитиком кратно возрастут.

А вы готовы бустануть свои знания и скиллы в аналитике?

🔗 Регистрируйтесь на интенсив здесь → ссылка.


Реклама. ООО «АЙТИ РЕЗЮМЕ». ИНН 4025460134.
Erid:LjN8KQpUo

Читать полностью…

Datalytics

Как системному аналитику DWH попасть в Тинькофф? О чем спросят на собеседовании? Какие задачи предложат решать?

Все ответы — на Tinkoff DWH Connect. В апреле пройдут три онлайн-мероприятия для системных аналитиков DWH. Уровень мидл и выше.

Вот что будет:

— Weekend Offer, 20 и 21 апреля. Можете попасть в команду Тинькофф за пару дней. Пройдете все этапы собеседования за выходные — и, если все понравится, оффер ваш.

Посетите все три ивента или сразу приходите на собеседование.

Зарегистрируйтесь до 17 апреля. Детали тут

erid:2VtzquZhf7u
Реклама. АО "Тинькофф Банк", ИНН 7710140679, лицензия ЦБ РФ № 2673

Читать полностью…

Datalytics

🔥 Word embedding: что это и как применяется в NLP

👉 Расскажет Мария Тихонова – PhD Computer Science, Senior Data Scientist в SberDevices и преподаватель ВШЭ. Встречаемся на бесплатном практическом уроке от OTUS, где вы:

— узнаете, что такое векторные представления слов;
— изучите алгоритм word2vec;
— научитесь применять его на практике.

Встречаемся 17 апреля в 18:00 мск в рамках курса «Natural Language Processing (NLP)». Доступна рассрочка на обучение!

💣 Пройдите короткий тест прямо сейчас, чтобы посетить бесплатный урок и получить запись: https://clck.ru/3A69M7

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru

Читать полностью…

Datalytics

В штаб блока "Daily Banking" ищем Руководителя проектов для запуска портфельных кампаний на базе Self Service — автоматизированной CRM системы для формирования и запуска пилотов.

Основные задачи: формирование и координация бэклога с задачами команд, запуск портфельных кампаний, анализ и подведение итоговых результатов; постановка задач команде data science и аналитики, координация разработки ИИ моделей для роста конверсии и эффектов.

Вакансия для тех, кто знает рынок, понимает ключевые тренды и стратегии банков на карточном рынке страны.
Подробные условия и отклик по ссылке.

Читать полностью…

Datalytics

❗️Ребята, всем привет! Ищу кого-то, кто сможет экспертно пособесить на роль Python-разработчика за вознаграждение (2,5К₽ за 1 техническое собеседование) ❗️

Ищу себе Senior Python-разработчика для реализации проектов, связанных с применением LLM для образовательных задач (сборка разных прототипов, использующих данные диалогов, для построения эффективной образовательной поддержки по школьным предметам). Сейчас в команде нет экспертизы в бэковой Python-разработке, поэтому нужен кто-то кто сможет пособесить

Ниже описание вакансии

Задачи:
Проектировать и разрабатывать сложные системы как с синхронной, так и с асинхронной моделью взаимодействия;
Развивать продукт на основе бизнес и технических метрик (тесно работать с Technical manager над проработкой сценариев чат-ботов)
Развитие web-интерфейса AI-помощников (бэковая часть)
Участвовать в контроле качества разработки через ревью и настройку общих правил в CI;
Работать совместно с командой ML разработчиков и технических менеджеров;
Интегрировать AI-системы с другими сервисами и платформами;

Ожидаем от вас:
Отлично знаете Python 3, есть опыт промышленной разработки на Python от трех лет;
Есть опыт многопоточного и асинхронного программирования;
Понимаете основы построения микросервисной архитектуры приложений, клиент-серверных взаимодействий;
Знаете и применяете паттерны проектирования;
Умеете работать с фреймворками: FastAPI, Flask, Django или другими;
Умеете работать с реляционными СУБД PostgreSQL,MySQL и ORM (alchemy);
Умеете работать с контейнерами (docker, docker-compose).

Будет плюсом:
Кругозор в области ML, DL и современных тенденций на рынке AI-технологий;
Опыт интеграции с LLM API, включая ChatGPT, Claude, LangChain, GigaChain и PromptFlow;
Написание чат-ботов для Telegram или иных ботов;
Опыт использования Clickhouse, Cassandra, Elasticsearch;

Если не просто хотите пособесить, а попробовать себя на вакансию, то тоже пишите мне @ax_makarov

Читать полностью…

Datalytics

🚀 Участвуй в True Tech Hack от МТС и поборись за общий призовой фонд в 1 500 000 рублей. Регистрируйся.

Приглашаем разработчиков, специалистов по Data Science, менеджеров по продукту, дизайнеров. Соревноваться предстоит в одном из двух треков, чтобы улучшить жизнь людей с особыми потребностями.

🏠 Трек 1. Улучшение клиентского опыта витрины МТС Live для пользователей с особыми потребностями
⭐️ Трек 2. Разработка голосового управления для МТС Финтех на основе искусственного интеллекта для людей с ограниченными возможностями

Как пройдет True Tech Hack:
🔸 26 апреля – открытие хакатона и Q&A-сессия
🔸 27 апреля-12 мая – чек-поинты с экспертами
🔸 12 мая – окончание приема проектов
🔸 14 мая – полуфинал, защита лучших решений и объявление финалистов
🔸 17 мая – финал в Москве

True Tech Hack – твой шанс получить новый опыт, выиграть приз и сделать наш мир доступней и удобней для всех. Регистрируйся на хакатон до 25 апреля по ссылке.

Читать полностью…

Datalytics

Напоминаю, что помимо канала, в который я размещаю рекламу и периодически информативные репосты, у меня еще есть канал, где я делюсь разным про рабочие процессы, управление, философию, сложность систем и в особенности антропоцентричных систем

Например, недавно написал там пост про списки должностных обязанностей (ака job descriptions) и про то, что важно выходить за их рамки

Из более технического – пост про парадокс Джевонса и AI

В общем, если у вас есть желание читать длинные размышления о материях, из которых состоит наша жизнь – добро пожаловать в канал

Читать полностью…

Datalytics

Сможете разгадать тайны Гиперкуба?

Проявите смекалку и примените ИТ-скиллы на Tinkoff CTF — соревновании по спортивному хакингу. Победителям — призы до 420 000 ₽. Вот как все устроено:

— Выберите лигу: опытных или новых игроков. Задания рассчитаны на ИТ-специалистов уровня мидл и выше. Если играете впервые, можете потренироваться с демоверсией заданий.

— Соревнуйтесь в одиночку или командой до трех человек. Организаторы помогут найти команду, если нет своей.

— Играйте онлайн или офлайн — в одном из 16 городов России, Беларуси и Казахстана.

— Используйте время на решение заданий или общение с участниками — у вас будет 36 часов.

Задания будут интересны разработчикам, QA- и SRE-инженерам, аналитикам и другим опытным ИТ-специалистам.

Зарегистрируйтесь до 19 апреля и пробуйте свои силы


erid:2VtzqukQRVg
Реклама. АО "Тинькофф Банк", ИНН 7710140679, лицензия ЦБ РФ № 2673

Читать полностью…

Datalytics

У нас новости! Мы обновили каталог датасетов — теперь в нем есть 240 миллионов строк муниципальной статистики, 135 тысяч судебных дел об убийствах и данные о смертности с 1999 года

В начале декабря мы запустили каталог — раздел с открытыми данными, собранными в удобные машиночитаемые датасеты. С тех пор им воспользовались больше трех тысяч раз, а данные скачивали как журналисты, так и исследователи.

Сегодня мы открыли доступ к пяти новым датасетам — четыре из них не найти в других источниках.

◾️Муниципальная статистика c 2005 года. Это самый детализированный источник о жизни россиян. Здесь численность населения, миграция, зарплаты, доходы и расходы местных бюджетов, финансовые результаты компаний и много чего еще — всего 546 показателей. Можно скачать как отдельный показатель, так и подборку по определенной теме.

◾️Проекты конкурса Фонда президентских грантов c 2017 года. Все поданные за семь лет заявки с подробными описаниями и суммами, которую получили победители. Можно смотреть, как изменились приоритеты государственной грантовой поддержки в последние годы.

◾️Коэффициенты смертности в регионах России. Мы собрали длинные ряды коэффициентов смертности от разных причин с 1999 года в разрезе регионов, пола и возрастных групп.

◾️Дела и тексты судебных решений по статье 105 УК «Убийство». В этом датасете 135 тысяч судебных дел за восемь лет. Он поможет проанализировать, при каких обстоятельствах в России чаще всего совершаются убийства и что влияет на решение суда.

◾️Численность населения в муниципальных образованиях и населенных пунктах с разбивкой на мужчин и женщин. Мы пересобрали итоги переписи в удобный для работы формат плоской таблицы. А еще обогатили данными сервиса DaData о географических координатах муниципальных образований и населенных пунктов.

⚫️Если у вас есть пожелания по форматам данных или новым наборам — напишите в чат. Ваши замечания мы учтем в новых обновлениях. Чтобы у нас получилось собирать больше датасетов — поддержите нас. Это можно сделать через Boosty или Patreon.

Читать полностью…

Datalytics

🌟 Как проходит собеседование на продуктового аналитика в Авито?

Присоединяйтесь к трансляции на канале AvitoTech 4 апреля в 18:00. Вместе с Вовой Камчаткиным, продуктовым аналитиком в компании inDrive, увидите, какие вызовы и задачи ждут вас и как к ним лучше подготовиться. А ещё сможете отвечать на вопросы Егора Беседина, руководителя продуктовой аналитики в Авито, и задавать свои.

А 6 и 7 апреля используйте полученные знания на Weekend Offer для аналитиков. Оставляйте заявку, проходите собеседование и получайте оффер! 🔥

Читать полностью…

Datalytics

🔥 Хотите добавить в резюме компетенции Spark-разработчика?

Приходите на бесплатный практический урок «Spark Connect — что это такое и зачем оно нужно» от OTUS. Спикер Вадим Заигрин — Team Lead команд инженеров данных.

В Spark 3.4.0 появился Spark Connect. На вебинаре мы разберем, что это такое, какие задачи он решает и как его использовать.

📌 Встречаемся 4 апреля в 20:00 мск в рамках курса «Spark Developer». Доступна рассрочка на обучение!

💣 Пройдите короткий тест прямо сейчас, чтобы посетить бесплатный урок и получить запись: https://clck.ru/39ixtr

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru

Читать полностью…

Datalytics

🚀 Готовы стать мастером PostgreSQL?
Присоединяйтесь к открытому онлайн-уроку «Управление собственным облачным кластером PostgreSQL на CloudNative PG»!

💎 На этом уроке вы:

- узнаете как настроить отказоустойчивый кластер PostgreSQL с использованием оператора для Kubernetes CloudNative PG;

- промоделируете ситуации отказа отдельных узлов, настроим мониторинг доступности и наблюдение за операционными метриками кластера;

- научитесь делать восстановление состояния на указанный момент времени.

📅 Дата проведения: 28 марта, 20:00 мск

🔗 Регистрируйтесь по ссылке и станьте экспертом в PostgreSQL! Новые навыки ждут вас! 🌟

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576

Читать полностью…
Subscribe to a channel