Датавиз, аналитика и всякое полезное и интересное 💜 Кто я и что делаю: https://nastengraph.notion.site/nastengraph/Anastasiya-Kuznetsova-096ebfb42a9e4014b7700fa00fea54d6 🎓 Мой курс по основам датавиза: https://stepik.org/a/92012 рек
⬅️ Почему стоит выравнивать текст по левому краю?
Весь текст в графиках и дэшбордах лучше всегда выравнивать по левому краю — на это есть несколько причин:
- мы читаем слева направо
- F-паттерн: взгляд сначала движется слева направо, затем — вниз по левой стороне
- в графиках и KPI-карточках глаз точно знает, где начнётся следующая строка, и не «скачет»
- не создаётся рваный край слева
- в дэшах такое выравнивание выглядит симметрично и аккуратно
Короче, всегда выравниваем по левому.
Единственное исключение — выравнивание чисел в таблицах: выравнивание по правому краю там нужно для удобства сравнения по разрядам.
Что делать если одна метрика выросла, а вторая упала?
Дима Некрасов из JetMetrics показал основные e-commerce метрики и что делать при их совместном изменении. Конечно же, это не закроет все кейсы, но очень хорошая отправная точка "куда копать".
Рыбки в ggplot
Просто Georgios Karamanis нарисовал рыбок на R пакетом ggplot2. Вдохновился этим видео, может тьюториал запилит.
Очень мне нравится, когда инструменты вот так используют "не по назначению", всегда что-то прикольное.
В каких регионах население больше, чем в ...?
Не знаю, зачем вам эта статистика — просто увидела такую карту по США и захотелось повторить.
Население больше, чем в Санкт-Петербурге, только в Москве и ее области и в Краснодарском крае.
Ссылка на табло. Можно просто потыкать на карте: кликаете на регион — и будет происходить сравнение с ним. Есть версия в виде плиток и обычной карты.
Собрать, может, след этапом население vs площадь...
Кто выигрывает войны?
Какой-то бум на 3D-визы. На этот раз — визуальная история конфликтов с 1816 по 2007 год. Не могу сказать, что 3D здесь как-то особенно добавило полезности — всё равно в основном просто перетыкиваешь. Но дизайн интересный: красные точки — страна проиграла, синие — выиграла, серые — ничья.
Как оформлять графики для научных статей?🔬
Недавно на курсе спросили, есть ли доп требования к графикам в статьях:
📍Базово правила такие же, как и не для научных статей: не врать графиком, аккуратно и верно его строить. Этому учимся на курсе. Есть еще книжка от Claus Wilke, он писал ее как напутствие своим аспирантам, очень советую главу про uncertainty.
📄 Есть гайдлайны журналов, в которых публикуетесь, они могут уже быть более специфичными и зависеть от того, будут ли печатать статью. Например, если печать будет в чб — придется менять цвет на паттерны (способы адаптаций к чб). Есть классный гайдлайн от Nature или Springer. Чаще они больше про формат, тип или способ использования, например, от Wiley.
🖋 Проверять, как графики заверстаны — будет ли удобно на них ссылаться. Часто авторы не добавляют заголовки ("Рис. 1" — недостаточно): чтобы понять, о чём график и не искать ответ в длинном тексте, ему обязательно нужен заголовок! Пример — на картинке к посту.
❤️Приходите практиковаться на гибкий график
Цвета кадров из 1 сезона Severance
Угадайте сцену на предпоследней строчке)) Досмотрела на днях второй сезон – интересное, хоть и чутка затянутое местами.
Если понедельник не понедельнится, советую песню Thunderstruck до завтрака – день заиграет новыми красками ⚡️
Читать полностью…Почему BI-проекты проваливаются. 10 основных ошибок и как их избежать? 🚀
24 апреля буду на конференции KARPOV.CONF 2025 рассказывать про ошибки в BI, которые ловила сама или часто встречала, а также пыталась решить (местами успешно).
📍Конференция бесплатная, регистрация по ссылке
Программа и спикеры просто ах!🤌 Приходите послушать, первый раз буду не про графики 🙃
Хочу поделиться классным прогрессом перевёрсток студентки курса "гибкий график" 🚀
Виктория работает в Power BI, и мы часто упираемся в ограничения инструмента с тз сложных визуализаций. Один из графиков ака таблиц переделывали долго, шаг за шагом — снизу финальная версия после ~8 итераций. В процессе открыли новые фишки PBI, я даже сама полезла туда рисовать графики (камбэк в инструмент спустя лет 8).
Отдельно хочу похвалить Вику за то, что хотела довести визуал до ума, несмотря на все сложности. В итоге — кастомное решение:
– объединение нескольких графиков в единую таблицу
– подписи и легенды как отдельные текстовые поля
На курсе все делают домашки в разных инструментах, и по ходу вместе находим "элегантные костыли" и фичи. В следующий раз расскажу, как мы мучали Looker Studio 🙃
ps курс можно купить от компании — если группа от 5 человек, можем организовать запуск с дедлайнами
Пазл из карты 🧩
Вводите любую локацию и соберется мини-пазл. Можно задать стиль и размер (чем больше, тем сложнее) и пособирать квадратики.
Третий день переношу источники из таблошного custom SQL в dbt. Чувствую себя немножко дата-инженером 🛠
Всем аналитикам и BI-разработчикам — если ещё не сталкивались с dbt, очоч рекомендую посмотреть. Важный кусочек того самого modern data stack.
📍dbt — буковка T в ETL. Условно, что делает dbt: создаёт модели, которые можно материализовать как таблицы. Вместо того чтобы пихать custom SQL внутрь дэша, вы можете его сделать нормальной таблицей, разбить на несколько частей, ещё и тестами обвесить, и посмотреть зависимости таблиц друг от друга.
У нас сейчас dbt Cloud — он платный, но при этом супер понятный. Бесплатно можно поднять самостоятельно dbt core.
- бесплатный курс по dbt cloud fundamentals, я прошла его и еще несколько с их сайта, хватило для базы и получается самостоятельно все админить, но там еще есть куда копать и улучшать
- если готовы разворачивать самостоятельно, Дима недавно проводил вебинар по dbt core
- большой гайд по dbt
- еще есть чатик в телеге @dbt_users и коммьюнити в слаке
Дата-портрет в стиле Баухаус 🧡
Jacqui Moore сделала интерактивный дэш, позволяющий сгенерировать свой дата-портрет на основании нескольких вопросов. Попробовать можно по ссылке.
ps такое прикольно делать целой командой, каждый делает себе портрет, а дальше на стенку в офис 💫
Data Visualization & Communication ✨
Веб-сайт курса Data Visualization & Communication, который в зимнем семестре вела Sam Shanny-Csik вместе с коллегами, на мой взгляд, один из самых лучших курсов не только по визуализации данных, но и среди многих других аналогичных курсов по Data Science.
Курс нацелен на создание эффективных визуализаций, начиная от вопросов, какие типы визуализации наиболее подходят для ваших данных, до создания графиков в {ggplot2} и его расширениях.
👉 Те, кто готовит свои собственные курсы, обратите внимание - здесь все на высоте: проработанность материала, список ресурсов, задания, оформление, очень подробный и качественно сделанный материал.
Первые буквы самых населенных городов в США
Понравилось сочетание small multiples с распределением. Слово "Largest" можно было бы написать только у первой карты)
Пингвины в Антарктике🐧
Так и не скажешь, что Tableau! Маг и волшебник Dennis Kao. Светящиеся точечки – это density марки, а карта через спутниковую картинку + mapbox.
Текст в графиках 📄
В курсе есть отдельная глава, посвящённая только тексту. В ней учимся работать с текстом с точки зрения его функций: сокращать, доносить основную мысль, выделять важное и делать текст понятным и читаемым.
Показываю кусочек про заголовки графиков в дэшбордах. У вас может быть отличный дэш с тз визуализаций, но если текст к нему оформлен плохо, он потеряет весь смысл.
Курс можно проходить в своём темпе и начать заниматься уже на майских 🤓
Если бы вся страна села за руль одновременно 🚗
Сколько человек в среднем приходится на одну машину:
- На голубом фоне страны, в которых если бы все решили поехать на машине одновременно, кому-то пришлось бы ехать на заднем сиденье
- На оранжевом – там автомобилей столько, что в каждую машину можно посадить одного человека спереди.
Here we go again!
Мы снова делаем мастерскую по дата-журналистике «Системного блока» с 19 июля по 3 августа 2025 года на Волге недалеко от Дубны. Прошлый год был легендарный. Но в этом году хотим сделать ещё лучше.
Мы ждём опытных и начинающих журналистов, студентов и выпускников гуманитарных специальностей, программистов, аналитиков данных, дизайнеров, иными словами, всех, кто хочет попробовать себя в новой сфере.
Неделю вы будете учиться, вторую неделю — делать дата-журналистский проект от наших партнёров, который потом будет опубликован на их площадках и на сайте Системного блока. А ещё готовить, мыть посуду, проводить вечера у костра, веселиться, общаться и отлично проводить время.
Для того, чтобы попасть к нам, нужно подать заявку до 18 мая и сделать тестовое. Скажу сразу, велика вероятность, что будет конкурс. Но это не повод паниковать. Мы вас очень ждём!
А ещё мы мутим там одну такую классную артовую штуку!
На картинке карточки студентов прошлого года Насти и Тима. Да, гарантирую, вы будете мечтать о горячем душе и том, чтобы выспаться. Но вы почти наверняка не пожалеете об этой поездке.
Генератор тем для PowerBI💫
Натыкиваете цвета и получаете json файл с цветовой темой. Вот тут делала большую подборку про инструменты для выбора цветов.
Бенчмарки дата-команд 🔎
На сайте databenchmarks можно посранивать размеры дата-команд, распределение ролей, примерные зарплаты и стек.
Например, в Revolut очень много аналитиков и относительно мало ML инженеров, а в Nordea (это банк) больше 15% дата команды отвечают за дата говернанс. В Tinder мало BI-щиков, но много ML. А вот по технологиям PowerBI популярнее Tableau, а среди дата-каталогов лидирует Collibra и Alation.
На каждую тематику разные выборки, но относительно крупные и компании известные.
Tableau конференция 2025
Dev on Stage обещают
🎨 Более простой импорт палитр цветов, еще и с AI погенерить можно
🔘 Закругленные углы в дэшах)) После этого, думаю, перестанут делать так много подложек в фигме с кругляшами
🗑 Корзина, в которую будут попадать удаленные дэши и тд! Теперь можно будет их восстанавливать
🔎 Улучшенный лог активностей пользователей – наконец-то можно будет посмотреть, что люди фильтруют
Из видосов пока смотрела только How to Do Cool Stuff in Tableau от близнецов Flerlage, она же есть у них в текстовом формате
3D датавиз про NBA 🏀
Очень интересный вариант показать данные трехмерно. График показывает каждый момент, когда команда 🟦вела или 🟥проигрывала в течение сезона.
Одни и те же данные с разных сторон можно посмотреть как барчарт, линейный график или хитмап. Необычный, но интересный вариант на потыкать.
Какая классная переделка графика про сосиски 🌭
Был изначально просто скаттерплот. Неплохой, но и не лучший))
Что сделал автор:
- поменял оси местами, теперь идет «от меньшего к большему»
- разбил график на несколько, чтобы рассказать историю про каждый тип, но сверху оставил общий виз
- аннотации и работа с текстом
ps фон разбил прям на две части, но композиция подразумевалась единая
Сортировка в графиках📈
🔤 Алфавитный порядок
– Часто используется по умолчанию
– Полезен, если пользователь знает, что ищет
– Не помогает восприятию паттернов
🔢 Числовое значение
– У каждой категории одно число (сумма, среднее и т.д.)
Например, сортировка в барчарте по убыванию
📈 Агрегированное значение
– У категории несколько срезов (например, хитмапы)
Можно сортировать по среднему, макс/мин — например, строки хитмапа по среднему значению в периоде
🧩 Паттерн
– Сортировка по форме тренда/структуре
– Подходит для множества графиков или матриц
Например, отсортировать линии по тренду, а строки/столбцы матрицы — по визуальному паттерну.
Сортировка помогает сразу увидеть важные паттерны и усиливает восприятие. Не забывайте ее применять в зависимости от того, какой порядок хотите показать.
Совет по документации и комментированию кода
💡Explain why, not what
❌ -- исключаем клиентов без user id
✅ -- У клиентов без user_id не может быть платежей, в этой таблице нужны только платные
🏒Овечкин: 895 шайб и откуда они летели
У нас в закрытом чатике выпускников курса последние два дня много обсуждают, как и кто показал рекорд Овечкина в виде инфографики. Стас скинул вот такой видосик из инсты, где показывали каждую шайбу и откуда она была забита. Идея очень классная — но реализация полный отстой: такие крутые данные, а увидеть картинку целиком нельзя. Как мне кажется, оно ещё и сделано не на реальных данных. По крайней мере, последняя шайба точно не из этой позиции.
В итоге я взял Танину идею, которую она сделала в Табло, и дополнил данными координат. Мне прям нравится, как получилось!
Использовал Gemini для сборки данных и работы с API, а Cursor — чтобы это всё накодить. Вообще, для вот такого рода проектов это какая-то чума. Я за пару вечеров собрал эту штуку — и она работает! Чудный новый мир.
Потыкать самому — https://revealthedata.com/examples/ovechkin/
#пример
Первые буквы городов России
Вдохновилась постом и решила собрать похожее в Таблошке (map layers + шеймп файлик границ регионов).
Шпаргалка по игре в "города"))
Государственные расходы Канады
Саша Бараков прислал прикольный виз. Мне кажется, очень прикольно интерактивно реализовано. Мелкие категории скрыты за скроллом, но все так отзывчиво работает, что по кликам быстро подтягивается и показывается. Хочется прям смотреть и исследовать.
Много KPI-карточек через один виз 💫
Виталий Ковалев (когда мы еще работали вместе и строили дэшики в Таблеау в команде Ромы Бунина) собрал очень крутой дэш, переиспользовав одну визуализацию несколько раз. На одном из #TUG он подробно его показал — вот преза, очень советую посмотреть.
Мне хотелось попробовать этот подход, и в итоге получился такой дэш. Я создала одну KPI-карточку, затем передала названия метрик через параметр и заэмбедила их ссылками. Вторая часть эксперимента для меня заключалась в том, что я впервые вынесла блок приростов вбок от основной цифры. Это позволило сравнивать приросты независимо, выстраивая их в ровную линию, при этом целостность карточки не нарушается благодаря общему фону.
ps на дэше будут скроллы с тулбаром, так как это Tableau Public, на сервере/клауде все будет работать норм