Нескучные позиции в Data Science
Позиция: Middle/Senior Data Scientist
Куда? Альфа-банк, Департамент продвинутой аналитики, Хаб Юридические Лица
Формат работы: Гибрид: Москва, м. Технопарк + удаленно
Вилка гросс:
• Middle: 180-250k + ежеквартальная премия + ~ 15% (от дохода за квартал)
• Senior: 250-350k + ежеквартальная премия + ~ 15% (от дохода за квартал)
Что делать на этой позиции?
• Разрабатывать, поддерживать и автоматизировать модели машинного обучения для Юридических Лиц (Малый, Средний и Крупный корпоративный бизнес)
• Совместно с бизнес-командами участвовать в анализе результатов работы моделей, генерировать новые идеи по применению моделей в бизнес-процессах, оценивать финансовый эффект от моделей
• Разрабатывать дизайн экспериментов для оценки качества моделей в бизнес-процессах
• Искать и тестировать новые источники данных для разработки моделей, генерировать фичи для разработки, продукционализировать источники совместно с командой дата инженеров
• Выстраивать мониторинг действующих моделей
• Автоматизировать имеющиеся подходы к разработке, разрабатывать алгоритмы AutoML
Решаемые задачи:
• Propensity, X-sell, Cross-sell, Churn, NBO, channel distribution, Marketing Optimization
• CVM, CLTV
• Транзакционное/поведенческое моделирование (поиск поведенческих паттернов)
• Прогноз фин. показателей, кошельки ЮЛ, сегментация рынка
• Графовая аналитика, поиск ЛПР
• Ресурсно-оптимизационные задачи
Что ожидаем от кандидата:
• Уверенный использование технологического стека: python, LightGBM/XGBoost/CatBoost, sklearn, pandas, numpy + sql + git
• Spark, Hadoop, Hive
• Знание классического ML
• Опыт перевода бизнес-задач в термины ML
Будет большим плюсом:
• Опыт работы в финтехе, телекоме на аналогичных позициях
• Знание и понимание особенностей корпоративного банковского бизнеса: специфика банковских продуктов, каналы продаж, управление воронкой и пр.
• Опыт применения моделей ML в бизнес-процессах в роли заказчика
Ответы на 10 важных вопросов:
1. Данные: Hadoop + частично DWH. Историчность с 2016г.
2. Железо: Мак + удаленка. Среда разработки - 64 ядра, RAM 512 ГБ. Инференс – универсальное общебанковское решение и команда MLOps.
3. Масштаб влияния на core-бизнес? Подтвержденный финансовый эффект от применения моделей Хаба Юридических Лиц в бизнесе в 2022г. составил величину с 9 нулями (в руб.).
4. Уровень развития Data Science в направлении? Все ключевые процессы покрыты моделями. Модели постоянно совершенствуются в целях максимизации финансового эффекта.
5. Роль дата сайентиста: полное участие DS во всех этапах жизненного цикла моделей от идеи до внедрения. Плотное общение с бизнес-заказчиком начиная от постановки задачи и заканчивая деталями применения модели в процессе.
6. Бэкграунд у вашего руководителя? Ссылка на LinkedIn.
7. Как часто вам будут мешать работать (операционный ритм встреч)? Для миддл уровня – ежедневные дейли + 1-2 ч организационных встреч с заказчиком еженедельно. Для сеньор уровня – ежедневные дейли + 3-4 ч организационных встреч с заказчиком еженедельно.
8. Карьерный рост: карьерная лестница в компании с утвержденным перечнем компетенций на каждой позиции. Круглые столы для рассмотрения кандидатов на продвижение 1р. в квартал.
9. Prod/Research: Prod. Основная цель – выполнение бизнес-КПЭ по росту продаж, активной базы, финансовому эффекту.
10. Функция сервиса или лидера? Сервис для внутреннего заказчика (бизнес), что однако дает возможности для творческого решения бизнес-задач различными техническими способами.
📧 DRuzanov@alfabank.ru ✈️ @DRuzanov
🔊 Ищем к себе в Лабораторию
Позиция: Junior/Middle Data Scientist
Куда? Альфа-банк, Лаборатория машинного обучения, NLP-команда
Формат работы: Удаленно в РФ или Москва, м. Технопарк. Возможна полная удаленка.
Вилка гросс: 120-200k/200-300k + ежеквартальный бонус ~ 15% (от дохода за квартал).
Про команду:
Все NLP-задачи компании решаются силами этой команды. Несколько примеров работы команды из паблика: про чат-бота, про работу с отзывами, про чеки.
Что делать на этой позиции?
Развивать модели ассистента оператора для ускорения обслуживания клиентов в чате и голосовом канале. Например, рекомендовать лучшие варианты ответов и интерфейсов со справочной информаций.
Работа DSa не ограничивается тюнингом параметров и выбора архитектур моделей. На этой позиции нужно будет плотно общаться с продуктовой командой и определять компоненты ml-продуктов, быть может с посещением КЦ, ставить задачи командам асессоров, дата инженеров, млопсов. Подробнее про роль дата сайентиста в нашей команде.
Требования:
• Опыт работы с нейронными сетями (учебные проекты/соревнования);
• Технологический стек: python + pytorch:, LightGBM/XGBoost/CatBoost, sklearn, pandas, numpy + sql + git.
• Понимание основных принципов и алгоритмов классического ML
• Умение выбирать метрику под бизнес-задачу
Ответы на 10 важных вопросов.
Присылать резюме на esmirnov6@alfabank.ru с темой письма: "NLP DS в Лабораторию".
Senior Data Scientist в направление Рекомендательной платформы🔥
Компания: МТС Big Data
Финансы: 300-350k gross
Локация: г. Москва, м. Технопарк (удаленная работа по России/офис)
Кандидат присоединится к работе команды рекомендательных систем для "Строки" в подразделении МТС Big Data.
В настоящий момент мы ищем специалистов для создания персональных рекомендаций по жанрам для текстовых и аудио книг.
В перспективе планируется сделать лучшие кросс-контентные рекомендательные модели.
Кого мы ищем:
- Знание классического ML
- Знание Python, опыт написания кода в прод
- Опыт внедрения ML в прод
- Знание статистики
- Опыт проведения A/B-тестов
- SQL или Spark (опыт работы с hadoop стеком: hadoop, spark, hive)
- Linux (bash)
- GIT
Что предстоит делать:
- Создание рекомендательной системы и вывод ее в прод
- Оценка ML моделей, управление эффективностью алгоритмов
- Подсчет результата пилотов по запускам инициатив (новая модель, новый триггер)
- Поиск инсайтов в данных
- Формирование и проверка гипотез
- Работа с сегментацией
Ответы на 10 важных вопросов
1. Данные
Объем данных - десятки петабайт на Hadoop, история по разным продуктам с 2018 года + оперативные данные в PostgreSQL, Cassandra, Aerospike, Redis и дт. Есть ролевая модель доступов. Все доступно с JupyterHub
2. Железо
Эджноды с 144 cpu + 2TB ram или 72 cpu + 1TB ram, на части нод 2хTesla V100 32GB. Разработка: dev машины OpenStack. Продакшн: виртуализованый k8s, либо виртуальные машины. Выделенная команда MLOps. Для работы: МакБук + удалённое рабочее место.
3. Масштаб влияния на core-бизнес?
МТС BigData - источник инсайтов для бизнеса, решениями пользуются почти все проекты МТС: от развития сети базовых станций до кредитного скоринга и рекомендаций в Кион
4. Уровень развития Data Science в компании?
Data Science - вершина "пищевой цепочки" данных в МТС, численность DS +- 45 человек. Стараемся использовать data-driven подходы везде где только можно, однако есть пробелы - хотим поправить, поэтому и нанимаем:)
5. Роль дата сайентиста
В зависимости от квалификации и интересов - от дата аналитики, BI, через AB тестирование до определения пути развития и фичей целых продуктов, кто-то пишет в продакшн, поддерживает уже созданное
6. Бэкграунд у вашего руководителя?
Linkedin
7. Как часто вам будут мешать работать?
Нужно ориентироваться на стандартные временные издержки характерные для Agile (scrum/kanban) + иногда корпоративные курсы для всех
8. Карьерный рост
Есть рамки софт/хард компетенций для разных уровней. Пересмотр зарплаты и ревью 2 раза в год, в промежутках 1to1 с руководителем по необходимости, есть ReadingClub - можно научиться у других или поделиться экспертизой.
9. Prod/Research
По нашему мнению хороший DS умеет многое - и поисследовать, и исследованием причинить пользу компании. К последнему рано или поздно вы должны придти, никто не продуктивизирует модели лучше чем вы сами
10. Функция сервиса или лидера?
В текущем положении дел распределение профессиональных функций смещено в "сервисную" область
🧰 Присылать резюме можно HR Даше в тг: /channel/Daria_Artemovna
Позиция: Middle Data Scientist
Куда? Альфа-банк, Департамент продвинутой аналитики, Хаб Риски, ЮЛ.
Формат работы: Гибрид: Москва, м. Технопарк + удаленно.
Вилка гросс: 180-280k + ежеквартальный бонус ~ 15% (от дохода за квартал).
Что нужно делать?
• Разрабатывать и поддерживать модели кредитного риска для поточного кредитования малого и среднего бизнеса (PD, LGD, EAD).
• Развивать и поддерживать внутренний фреймворк для разработки моделей.
• Генерировать и применять в моделях новые фичи на основе слабоструктурированных данных из Hadoop.
• Проводить эксперименты с нестандартными для классического скоринга подходами к моделированию.
• Анализировать эффективность новых источников данных и применять их в моделях.
Требования:
• Умение работать с данными (анализ, очистка, подготовка, отбор и создание признаков), навыки написания SQL-запросов.
• Хорошее знание теории вероятностей, математической статистики и методов машинного обучения.
• Опыт в разработке моделей машинного обучения от 1 года.
• Опыт работы c пакетами для анализа данных на Python3 (numpy, pandas, scikit-learn, xgboost, lightgbm, catboost, etc).
• Опыт работы с git.
• Желателен опыт работы с юридическими лицами, понимание, как устроена отчетность, какие модели и как можно применять для анализа компаний.
Ответы на 10 важных вопросов:
1. Данные: Hadoop + внешние источники по api. История 2017+. Данные доступны из среды разработки моделей.
2. Железо: Разработка моделей: kuber до 64 ядер + 512 ГБ оперативы. Продакшн: cистема исполнения моделей + выделенная команда MLOps. Для работы: МакБук + удалённое рабочее место.
3. Масштаб влияния на core-бизнес? Модели - ядро процесса поточного кредитования юрлиц, без них бизнес невозможен.
4. Уровень развития Data Science в компании? Все линии бизнеса покрыты ML моделями, где необходимо - успешно внедрен DL.
5. Роль дата сайентиста: ДС-ы участвуют в постановке задачи, совместно с командой рисков, прорабатывают генерацию фичей на условно подготовленных данных, обучают и документируют модель, подготавливают код для внедрения в прод, выполняют функцию аналитического сопровождения моделей после внедрения в прод.
6. Бэкграунд у вашего руководителя? linkedin
7. Как часто вам будут мешать работать? 2 часа организационных встреч в неделю.
8. Карьерный рост: круглый стол раз в квартал + формализованная матрица компетенций для каждой роли.
9. Prod/Research: Prod. От моделей требуется польза и эффективность.
10. Функция сервиса или лидера? На данном этапе сервисных функций больше.
📧 Akvolkov@alfabank.ru ✈️ @v0lkoff
Позиция: Middle Data Scientist (Благодаря прошлому посту команда выросла с 4 человек до 5. Продолжаем органический рост).
Куда? Альфа-банк, Департамент продвинутой аналитики, Хаб Риски, ЮЛ.
Формат работы: Гибрид: Москва, м. Технопарк + удаленно.
Вилка гросс: 180-250k + ежеквартальный бонус ~ 15% (от дохода за квартал).
Что нужно делать?
• Разрабатывать и поддерживать модели кредитного риска для поточного кредитования малого и среднего бизнеса (PD, LGD, EAD).
• Развивать и поддерживать внутренний фреймворк для разработки моделей.
• Генерировать и применять в моделях новые фичи на основе слабоструктурированных данных из Hadoop.
• Проводить эксперименты с нестандартными для классического скоринга подходами к моделированию.
• Анализировать эффективность новых источников данных и применять их в моделях.
Требования:
• Умение работать с данными (анализ, очистка, подготовка, отбор и создание признаков), навыки написания SQL-запросов.
• Хорошее знание теории вероятностей, математической статистики и методов машинного обучения.
• Опыт в разработке моделей машинного обучения от 1 года.
• Опыт работы c пакетами для анализа данных на Python3 (numpy, pandas, scikit-learn, xgboost, lightgbm, catboost, etc).
• Опыт работы с git.
• Желателен опыт работы с юридическими лицами, понимание, как устроена отчетность, какие модели и как можно применять для анализа компаний.
Ответы на 10 важных вопросов:
1. Данные: Hadoop + внешние источники по api. История 2017+. Данные доступны из среды разработки моделей.
2. Железо: Разработка моделей: kuber до 64 ядер + 512 ГБ оперативы. Продакшн: cистема исполнения моделей + выделенная команда MLOps. Для работы: МакБук + удалённое рабочее место.
3. Масштаб влияния на core-бизнес? Модели - ядро процесса поточного кредитования юрлиц, без них бизнес невозможен.
4. Уровень развития Data Science в компании? Все линии бизнеса покрыты ML моделями, где необходимо - успешно внедрен DL.
5. Роль дата сайентиста: ДС-ы участвуют в постановке задачи, совместно с командой рисков, прорабатывают генерацию фичей на условно подготовленных данных, обучают и документируют модель, подготавливают код для внедрения в прод, выполняют функцию аналитического сопровождения моделей после внедрения в прод.
6. Бэкграунд у вашего руководителя? linkedin
7. Как часто вам будут мешать работать? 2 часа организационных встреч в неделю.
8. Карьерный рост: круглый стол раз в квартал + формализованная матрица компетенций для каждой роли.
9. Prod/Research: Prod. От моделей требуется польза и эффективность.
10. Функция сервиса или лидера? На данном этапе сервисных функций больше.
📧 Akvolkov@alfabank.ru ✈️ @v0lkoff
🔊 Ищем к себе в Лабораторию
Позиция: Junior Data Scientist
Куда? Альфа-банк, Лаборатория машинного обучения, Команда монетизации нейронных сетей.
Формат работы: Удаленно в РФ или Москва, м. Технопарк. Возможна полная удаленка.
Вилка гросс: 120-200k + ежеквартальный бонус ~ 15% (от дохода за квартал).
Наша команда занимается исследованием и построением моделей на слабоструктурированных источниках данных. На текущий момент в фокусе находятся текстовые, транзакционные, данные бки, история коммуникаций и данные кассовых чеков. Наша цель – усилить все модели банка за счёт новых подходов и источников данных. Метрики качества наших моделей напрямую конвертируются в прибыль банка, поэтому у нас глубокая интеграция с бизнесом. Мы вместе с заказчиками переводим задачи в ml термины и можем влиять на бизнес-процессы, основываясь на выводах из данных. Тем не менее, мы не только бежим вперед за KPI, но также успеваем читать статьи, осваивать новые архитектуры/модели для решения задач.
Очень подробно про команду и задачи можно узнать из трека DL in Finance.
Что нужно делать?
• Разрабатывать внутренний AutoDL сервис для покрытия нейросетями всех важных бизнес-задач: склонность к банковским продуктам, предсказание оттока, предсказание дохода, предсказание LTV, рекомендации спецпредложений от партнеров банка
• Развивать архитектуру нейронных сетей и методы их обучения для решения нескольких задач одновременно (Multi-task)
• Экстраполировать подход на данные из других источников: ПФР, история коммуникаций, чеки, мобильное приложение
Требования:
• Опыт работы с нейронными сетями (учебные проекты/соревнования);
• Технологический стек: python + pytorch:, LightGBM/XGBoost/CatBoost, sklearn, pandas, numpy + sql + git.
• Понимание основных принципов и алгоритмов классического ML
• Умение выбирать метрику под бизнес-задачу
Ответы на 10 важных вопросов:
На 9/10 важных вопросов есть ответы в оригинальной статье https://habr.com/ru/company/alfa/blog/709416/
6. linkedin
Присылать резюме на dkoptelov@alfabank.ru
Также можно писать в тг: @meacca
💡Вакансия: Senior Data Scientist
🥚Компания: МТС Диджитал, продукт Рекламная платформа RnD
💰Финансы: 250k-350k на руки (премии)
📍 Локация: г. Москва, м. Технопарк (офис/гибрид)
Кандидат присоединится к работе Big Data R&D команды МТС.
В настоящий момент основной фокус бизнес задач приходится на разработку маркетинговых продуктов – применение алгоритмов классификации, регрессии и рекомендательных систем для оптимизации медиа инвестиций. Перечень инициатив очень широкий – от задач стратегического планирования медиа бюджетов до оптимизации биддинговых стратегий в перформанс инструментах.
В ходе проектов работа будет вестись в команде с Data Science Тим лидом, а также DevOps и Data Engineering специалистами.
⚙️ Требования
• Глубокое понимание статистических подходов и методов (регрессия, свойства распределений, оценка максимального правдоподобия, проверка гипотез и их правильное использование) и опыт их применения
• Свободное владение основными DS библиотеками на Python (pandas, numpy, matplotlib, seaborn, etc. )
• Коммерческий опыт применения классических алгоритмов машинного обучения (LR, RF, XGBoost/LGBM/CatBoost)
• Достойный уровень инженерной культуры (умение писать адекватный код за вменяемое время)
• Высокий уровень владения SQL
📌 Что предстоит делать?
- Сбор и обработка данных из хранилищ компании
- Подготовка витрин данных, необходимых для разработки моделей машинного обучения. Задача частично закрывается data engineering специалистами
- Разработка моделей машинного обучения как для MVP проектов, так и решений, выводящихся в production
- Разработка методологий применения различных ML алгоритмов для решения задач команды. Подготовка рекомендаций по внедрению методологий и использованию продуктов для внутренних заказчиков компании
- Проведение консультаций и обмен идеями с младшими специалистами и коллегами по команде
Ответы на 10 важных вопросов:
1. Данные: Hadoop + базы отдельных команд (Clickhouse, Postgre/MySQL, Mongo). История 2017+. Данные доступны из среды разработки моделей.
2. Железо:
• Среда разработки моделей: кластер с несколькими эджнодами по 128 ядер и 1ТБ оперативной памяти.
• Продакшн: выделенная инфраструктура с MLOps поддержкой.
• Для работы: МакБук + удалённое рабочее место для доступа к закрытым базам.
3. Масштаб влияния на core-бизнес? Модели – один из важных фильтров обработки openRTB запросов в рамках DSP платформы. Без них бизнес показатели будут гораздо ниже рыночных стандартов.
4. Уровень развития Data Science в компании? Применяем как классические ML подходы, так и DL для решения отдельных задач. Большая часть команды – выходцы из Сбера, имеют успешный опыт разработки и применения моделей на всех этапах жизни, участия в соревнованиях и R&D
5. Роль дата сайентиста: участвует в обсуждении подходов/моделей для достижения требуемого бизнес-результата, в подготовке требований для датасета, его сборе. Является лидирующим звеном в процессе построения модели, после чего формулирует требования к MLOps команде для внедрения результатов в prod среду
6. Бэкграунд у вашего руководителя?
Linledin
Lead, и PO имеют 6+ лет опыта в DS (ML разработка, ML Ops, Аналитика). Сферы экспертизы: banking, telecom, marketing. В случае потребности обсудить какие-либо нетривиальные детали в алгоритмах/метриках есть возможность обратиться к коллегам с глубоким уровнем экспертизы почти в любом направлении DS (recsys, nlp, cv, graphs, etc.)
7. Как часто вам будут мешать работать? Ежедневные синки по 15-30 мин узким составом + ~2 часа в неделю для обсуждения бизнес-требований к модели с заказчиком и PO
8. Карьерный рост: ежегодный пересмотр компенсации и актуализация потребностей в обучении/развитии лидерских навыков/смене проектной деятельности
9. Prod/Research: 80% Prod / 20% Research,
10. Функция сервиса или лидера? 80% сервис высокого уровня, 20% лидерство (постановка задач DevOps/Data Engineering/ и даже ML коллегам из других отделов, а также активное обсуждение методологии работы с теми или иными моделями и бизнес-метриками)
🧰 Присылать резюме можно HR Даше в тг: /channel/Daria_Artemovna
👥 Канал создан для сокращения времени матчинга между соискателем и работодателем в Data Science. Цель достигается за счет подробного описания каждой из вакансий, важной частью которого являются ответы на 10 важных вопросов перед трудоустройством в Data Science.
🙋 Data Scientist в этом канале сможет узнать все особенности работы на предлагаемой позиции до отклика на нее. 💬 Ответы на недостающие вопросы можно будет уточнить в комментариях к вакансиям.
🔎 Нанимающий менеджер или HR может опубликовать вакансию в этом канале, оформив вакансию по образцу (в ближайшее время появится ссылка на шаблон, пока смотрите на пример опубликованных вакансий) бесплатно на период юности канала. Пишите в лс @smirnovevgeny
❗️ В описании вакансий будут ответы на вопросы, но их верификация невозможна. Однако, будут открыты комментарии к каждой из вакансий и реакции, что позволит дополнить картину мнением со стороны.
❤️ На правах автора канала, буду выделять вакансии, которые смог бы порекомендовать лично. Буду готов потратить время на погружение в особенности работы на вашей вакансии, если вы уверены, что она достойна особого внимания подписчиков.
🏠 Докидывайте ваши вопросы с аргументами в комментарии. Популярные, хорошо аргументированные и поддержанные подписчиками вопросы станут обязательной частью описания вакансии.
🔄 Стартовый пост будет обновляться по мере развития канала за счет приобретенного опыта.