not_boring_ds_jobs | Unsorted

Telegram-канал not_boring_ds_jobs - Нескучный Data Science Jobs

6129

Нескучные позиции в Data Science

Subscribe to a channel

Нескучный Data Science Jobs

Позиция: Middle Data Scientist
Куда? МКБ, валидация
Формат работы: Гибрид: Москва, Москва-Сити + удаленно.
Вилка гросс: 200-300k + годовой бонус ~ 15% (от дохода за год).

Что нужно делать?
1. Валидация различных моделей (рисковые PD модели, а также бизнесовые модели, например, модель дохода клиента, модель оттока клиентов, модель утилизации лимитов и прочие), в том числе: - Формирование выборки и оценка качества данных для проведения валидации; - Качественный и количественный анализ: оценка дискриминационной способности, корреляционный и дисперсионный анализ, анализ документации, тестирование реализации модели в конвейере и др; - Проведение альтернативного моделирования;
2. Оптимизация и автоматизация процедур внутри отдела. Усовершенствование внутренних библиотек по автовалидации и альтернативному моделированию.

Требования:
• Умение работать с данными (анализ, очистка, подготовка, отбор и создание признаков).
• Навыки написания SQL-запросов (оптимизация скриптов, оконные функции, объединение, агрегация, создание и изменение объектов).
• Хорошее знание теории вероятностей, математической статистики и методов машинного обучения.
• Опыт в разработке/валидации моделей машинного обучения от 1 года.
• Опыт работы c пакетами для анализа данных на Python3 (numpy, pandas, scikit-learn, xgboost, lightgbm, catboost, etc).
• Опыт работы с git.
• Понимание основ риск-менеджмента является преимуществом.
• Умение работать с MLOps (Airflow, MLflow, Seldon) является преимуществом.

Ответы на 10 важных вопросов:
1. Данные: SQL (Oracle, Vertica) + внешние источники. Данные доступны из среды разработки моделей.
2. Железо: Разработка моделей: JupyterHub на kubernetes с возможностью выделения до 32 ядер + 128 ГБ оперативной памяти. Продакшн: cистема исполнения моделей + выделенная команда MLOps. Для работы: выделение ноутбука (8 ядер + 32 ГБ оперативной памяти) + удалённое рабочее место (VDI).
3. Масштаб влияния на core-бизнес? Без валидации ни одна модель не может быть введена в эксплуатацию + возможность альтернативным моделированием улучшить модель разработчика (фактически ваша модель пойдет в пром.)
4. Уровень развития Data Science в компании? Почти все линии бизнеса покрыты ML моделями. Каждый год увеличивается количество моделей (+10-20 шт.) и их сложность (до бустингов и нейронных сетей).
5. Роль дата сайентиста: ДС-ы проводят полную валидацию модели и альтернативное моделирование, качественную и количественную валидацию. Есть собственные библиотеки, покрывающие методику валидации, альтернативное моделирование и создание отчета о валидации в Python. Также осуществляется перевод имеющихся моделей и библиотек на MLOps и создание Dashboard’а по мониторингу моделей.
6. Бэкграунд у вашего руководителя? linkedin
7. Как часто вам будут мешать работать? 1-2 часа организационных встреч в неделю.
8. Карьерный рост: Ежегодное ревью.
9. Prod/Research: Prod, но при обоснованном желании можно позаниматься и Research’ем. Последний Research, проведенный командой, является анализ финансовой оценки изменения Gini при изменении модели.
10. Функция сервиса или лидера? На данном этапе сервисных функций больше.

Ваши резюме направлять 📧 kiselev.i.s@mail.ru ✈️ @igorigg

Читать полностью…

Нескучный Data Science Jobs

📣 Ищем к себе в Лабораторию стажера 🅰️

Позиция: Стажер DS

Куда? Альфа-Банк, Лаборатория машинного обучения, Монетизация нейронных сетей.

Формат работы: Москва, м. Технопарк. Возможна полная удаленка.

Вилка (gross): 60K, при успешной стажировке переход на позицию Junior DS: 120-240K + ежеквартальная премия (~15% от дохода за квартал)

Что предстоит делать на этой позиции?
Под руководством ментора разрабатывать и внедрять ML модели для улучшения процессов привлечения новых клиентов. Модели охватывают широкий спектр задач: предсказание склонности и одобрения, прогнозирование доходности, предсказание оттока/фрода и другие. В рамках стажировки предстоит не только писать код, но и плотно взаимодействовать с заказчиками, проводить A/B тестирование моделей, погружаться в бизнес-процессы банка.

Что ожидаем от кандидата:
• Опыт работы с классическим ML и DL (учебные проекты / соревнования);
• Технологический стек: python + pytorch, LightGBM/XGBoost/CatBoost, sklearn, pandas, numpy + sql + git;
• Понимание основных принципов и алгоритмов классического ML и DL;
• Умение выбирать метрику под бизнес-задачу;
• Навык работы с инструментами Spark, Hadoop, Hive - как преимущество.

Будет большим плюсом:
- Призовые места на соревнованиях;
- Опыт решения ML-задач на графах.

Ответы на 10 важных вопросов:
На 9/10 важных вопросов есть ответы в оригинальной статье.

Руководитель:
Бэкграунд руководителя: linkedin

Присылайте резюме на почту NAParkhomenko@alfabank.ru с темой "Стажер в Лабораторию" / в ТГ @nickimpark

Читать полностью…

Нескучный Data Science Jobs

Позиция: Разработчик NLP (Middle/Senior)
Куда: Альфа-Банк, Лаборатория Машинного Обучения, отдел NLP
Формат работы: Полная занятость. Удаленная работа или возможность работы из офиса в Москве
Вилка гросс: Middle: 260-360K, Senior: 360-460K + ежеквартальный бонус ~ 15% (от дохода за квартал)

Про нас:
Мы помогаем автоматически обрабатывать обращения клиентов за счет моделей для ботов в чате и голосовом канале. Снижаем рутину в работе оператора благодаря моделям для ассистента оператора и автоматической классификации обращений клиентов на 1000+ классов.
Покрываем широкий спектр NLP-задач: поиск инсайтов в обратной связи клиентов, классификация новостей с целью выявления событий комплаенс контроля, автоматизация обращений сотрудников в helpdesk, выявление алертов в качестве обслуживания, автоматизация контроля качества контактного центра и многие другие NLP-задачи. Команда приступает к следующему этапу развития через развитие экспертизы в LLM. Подробнее про часть задач можно узнать в треке NLP in Practice.

Тебе предстоит:
- Улучшать действующие модели в непрерывном цикле, состоящем из поиска инсайтов -> разметки -> моделирования -> А/Б-тестирования.
- Строить RAG-пайплайны для обслуживания сотрудников и клиентов Альфы.
- Дообучать LLM на банковском домене данных.
- Улучшать качество и эффективность моделей ассистента оператора.
- Использовать LLM для автоматизации процессов разметки данных.
- Развивать комплекс моделей для улучшения качества работы операторов и менеджеров в отделениях (контроль качества, суммаризация диалогов, семантический поиск, выявление инсайтов).

Требования:
- Опыт работы в области машинного обучения и NLP от 2 лет (Middle) / от 5 лет (Senior).
- Знание и опыт работы с языковыми моделями, такими как GPT, BERT и другими.
- Уверенные знания Python и библиотек для машинного обучения (TensorFlow, PyTorch).
- Опыт работы с библиотеками для NLP (transformers, torch).
- Знание основ работы с большими данными и опытом их обработки.
- Высшее образование в области компьютерных наук, математики или смежных дисциплин.
- Английский язык на уровне чтения технической документации.

Будет плюсом:
- Опыт работы с RAG (Retrieval-Augmented Generation) пайплайнами.
- Опыт работы с облачными платформами (AWS, Google Cloud, Azure, Датасфера).

Ответы на 10 важных вопросов в оригинальной статье.

Резюме направляйте на почту ✉️nbushkov@alfabank.ru с темой «Разработчик в лабораторию»

Читать полностью…

Нескучный Data Science Jobs

📣 Ищем к себе в Лабораторию еще одного специалиста для развития AutoML и AutoDL сервисов.

Позиция: Junior/Middle/Senior Data Scientist

Куда? Альфа-Банк, Лаборатория машинного обучения, монетизация нейронных сетей.

Формат работы: Москва, м. Технопарк. Возможна полная удаленка.

Вилка (gross):
- Junior: 120-240k + ежеквартальная премия (~15% от дохода за квартал)
- Middle: 240-360k + ежеквартальная премия (~15% от дохода за квартал)
- Senior: 360-460k + ежеквартальная премия (~15% от дохода за квартал)

Одно из направлений работы Лаборатории в Альфа-банке - автоматизация рутинных ML процессов и внедрение новых технологий в качестве сервисов для улучшения работы. За последний год мы создали 2 сервиса автоматического моделирования - AutoML и AutoDL, кроме того несколько сервисов снимающих рутинные обязанности с DS'ов, а сегодня мы ищем новых сотрудников для их расширения и развития.

Что предстоит делать на этой позиции?
- Развивать кастомные сервисы автоматического моделирования (AutoML, AutoDL) и автоматизации рутины (веб-интерфейсы для моделей, сервисы для аналитики)
- Внедрять в сервисы новые данные и типы моделей
- Улучшать стабильность и качество текущих AutoML алгоритмов
- Оптимизировать код
- Поддерживать пользователей (технически подкованных DS)
- Работать совместно с командами DE, MLOps, Мониторинга над интеграциями сервисов в промышленную среду
- Лидировать развитие новых направлений автоматизации: в частности, автоматизацию оценки эффектов от новых источников данных

Что ожидаем от кандидата:
- Промышленный опыт разработки и внедрения нейросетевых моделей (для middle и выше).
- Знание классического ML.
- Уверенное владение ML- и DL-стеком Python: Pytorch, lightgbm/xgboost/catboost, Scikit-Learn, Pandas, Numpy.
- Умение работать с инструментами Spark, Hadoop, Hive.
- Опыт перевода бизнес-задач в термины ML (для middle и выше).

Будет большим плюсом:
- Контрибьют в ML-библиотеки
- Опыт full-stack разработки
- Успешный соревновательный опыт
- Навыки с NAS, математической оптимизацией

Ответы на 10 важных вопросов в оригинальной статье. Про непосредственного руководителя - Kaggle Competition Master, linkedin
Наши сервисы: AutoML , AutoDL (AutoDL)

Присылайте резюме по почте OSidorshin@alfabank.ru с темой “DS в Лабораторию”.

Читать полностью…

Нескучный Data Science Jobs

Закрыли одну позицию, ищут еще одного

Позиция
: Руководитель проектов Data Science
Компания: Альфа-Банк
Локация: Москва, м. Технопарк. (гибрид, 1-2 дня в офисе)
Вилка гросс: 300-400k + ежеквартальная премия (~30% от дохода за квартал)

В Альфа-Банке уже внедрены сотни моделей машинного обучения и сорваны большинство низко-висящих фруктов. Дальнейшее развитие возможно через глубокое погружение бизнеса в нюансы Data Science. Новый член команды поможет нам сократить оставшийся гэп между бизнесом и Data Science. Эта позиция в бизнес-подразделения для специалиста, который хорошо разбирается в Data Science (но не будет делать его своими рукоми), проектном менеджменте и обладает хорошими софт скиллами.

Задачи:
⁃ Находить точки роста бизнес-процессов за счет Data Science
⁃ Выбирать продуктовые метрики, на которые будут влиять модели
⁃ Ставить задачу по разработке ML-модели вместе с командой Data Science
⁃ Контролировать соответствие разработанной модели поставленным целям
⁃ Заказывать внедрение и интеграцию модели в бизнес-процесс у смежных подразделений
⁃ Подготавливать бизнес-процесс для интеграции моделей машинного обучения
⁃ Контролировать эффективность работы модели в ПРОМ
⁃ Проверять просты гипотезы с использованием SQL и Python
⁃ Отвечать за PnL продукта и портфеля

Что ожидаем от кандидата:
⁃ Знание структуры прайсинга кредитного продукта, знание структуры PnL
⁃ Умение оцифровать потенциал продукта,
⁃ Технологический стек: Python + SQL
⁃ Глубокое понимание всех этапов жизненного цикла моделей + ML System Design
⁃ Уверенное знание теории вероятностей и математической статистики
⁃ Понимание когда DS нужно применять, а когда нет
⁃ Высокие навыки презентации результаты своей работы топ-менеджменту
⁃ Опыт ведения проектного менеджмента


1. Данные: Hadoop + частично DWH. Историчность с 2016 г.
2. Железо. Разработка моделей: до 64 ядер CPU + 600 ГБ RAM + 2xNVIDIA A100 80GB. Продакшн: cистема исполнения моделей + команда MLOps + команда DE + команда поддержки. Для работы: MacBook.
3. Масштаб влияния на core-бизнес. Все линии бизнеса покрыты ML моделями, где необходимо – успешно внедрен DL.
4. Уровень развития Data Science. Все ключевые процессы покрыты моделями. Модели постоянно совершенствуются в целях максимизации финансового эффекта.
5. Роль дата сайентиста. Не применимо для данной позиции
6. Бэкграунд у вашего руководителя. linkedin
7. Как часто вам будут мешать работать. Работа проектная => около половины времени - это встреч со смежными командами
8. Карьерный рост. Подразделение только формируется => потенциал вертикального роста
9. Prod/Research. Prod.
10. Функция сервиса или лидера. Функция лидера

Резюме направляйте на почту ✉️ rrazumovskiy@alfabank.ru с темой "Руководитель проектов Data Science"
Вопросы по вакансии в ЛС ✈️ @razumovsky_roman

Читать полностью…

Нескучный Data Science Jobs

Позиция: Data Scientist
Куда? Аэропорт Шереметьево, Дирекция разработки ИИ
Формат работы: Москва, м. Курска, офис
Вилка гросс: 230к - 400к гросс

Что нужно делать?
Вам предстоит заниматься разработкой системы динамического ценообразования для одного из крупнейших туроператоров в стране. Необходимо разработать систему прогнозирования оптимальных цен, систему реагирования на повышение спроса и мониторинга рынка.

Требования:
- Опыт внедрения моделей машинного обучения
- Хорошо владеете основами теории вероятностей и статистики
- Мыслите критически и умеете быстро вникать в бизнес-смысл
- Уверенно владеете SQL

Ответы на 10 важных вопросов:
1. Данные: postgres + внешние источники по api. История c 2021. Данные доступны из среды разработки моделей.
2. Железо: Разработка моделей: 100+ ядер, 150 ГБ RAM, Nvidia Tesla A2 и A100. Продакшн: 208 ядер + 512 ГБ RAM + 4 Nvidia Tesla T4. Для работы: ПК + 2 4К монитора
3. Масштаб влияния на core-бизнес? Модели формируют цены на туры. Основной драйвер роста прибыли - рост качества моделей. Проект только запускается, бизнес делает на него большие ставки.
4. Уровень развития Data Science в компании? ML 3 года используется в других продуктах, компания внедрила несколько решений с использованием DL.
5. Роль дата сайентиста: ДС-ы вместе с бизнес-аналитиками общаются с заказчиком, готовят фичи, обучают и документируют модель, готовят сервисы с моделями для продакшена, регулярно готовят отчеты о качестве работы моделей.
6. Бэкграунд у вашего руководителя? linkedin
7. Как часто вам будут мешать работать? 1,5 часа организационных встреч в неделю. 1 час общения один на один с руководителем в неделю.
8. Карьерный рост: четкого регламента нет
9. Prod/Research: Prod. Модели нужно обучать и внедрять оперативно, ошибки приносят ощутимые убытки бизнесу.
10. Функция сервиса или лидера? На данном этапе сервисных функций больше.

Направляйте ваши резюме - 📧 eb.sharov@svo.aero tg: @eugeneshar

Читать полностью…

Нескучный Data Science Jobs

📣 Ищем к себе в Лабораторию двоих специалистов для развития AutoML и AutoDL сервисов.

Позиция: Junior/Middle/Senior Data Scientist, 2 позиции.

Куда? Альфа-Банк, Лаборатория машинного обучения, монетизация нейронных сетей.

Формат работы: Москва, м. Технопарк. Возможна полная удаленка.

Вилка (gross):
- Junior: 120-240k + ежеквартальная премия (~15% от дохода за квартал)
- Middle: 240-360k + ежеквартальная премия (~15% от дохода за квартал)
- Senior: 360-460k + ежеквартальная премия (~15% от дохода за квартал)

Одно из направлений работы Лаборатории в Альфа-банке - автоматизация рутинных ML процессов и внедрение новых технологий в качестве сервисов для улучшения работы. За последний год мы создали 2 сервиса автоматического моделирования - AutoML и AutoDL, кроме того несколько сервисов снимающих рутинные обязанности с DS'ов, а сегодня мы ищем новых сотрудников для их расширения и развития.

Что предстоит делать на этой позиции?
- Развивать кастомные сервисы автоматического моделирования (AutoML, AutoDL) и автоматизации рутины (веб-интерфейсы для моделей, сервисы для аналитики)
- Внедрять в сервисы новые данные и типы моделей
- Улучшать стабильность и качество текущих AutoML алгоритмов
- Оптимизировать код
- Поддерживать пользователей (технически подкованных DS)
- Работать совместно с командами DE, MLOps, Мониторинга над интеграциями сервисов в промышленную среду
- Лидировать развитие новых направлений автоматизации: в частности, автоматизацию оценки эффектов от новых источников данных

Что ожидаем от кандидата:
- Промышленный опыт разработки и внедрения нейросетевых моделей (для middle и выше).
- Знание классического ML.
- Уверенное владение ML- и DL-стеком Python: Pytorch, lightgbm/xgboost/catboost, Scikit-Learn, Pandas, Numpy.
- Умение работать с инструментами Spark, Hadoop, Hive.
- Опыт перевода бизнес-задач в термины ML (для middle и выше).

Будет большим плюсом:
- Контрибьют в ML-библиотеки
- Опыт full-stack разработки
- Успешный соревновательный опыт
- Навыки с NAS, математической оптимизацией

Ответы на 10 важных вопросов в оригинальной статье. Про непосредственного руководителя - Kaggle Competition Master, linkedin
Наши сервисы: AutoML , AutoDL (AutoDL)

Присылайте резюме по почте OSidorshin@alfabank.ru с темой “DS в Лабораторию”.

Читать полностью…

Нескучный Data Science Jobs

Позиция: ML-инженер (Machine Learning Engineer)
Куда : МТС Диджитал
Формат работы: полный рабочий день, гибридный (удаленно / офис)
Вилка net: 260 - 300k ₽

Обзор проекта:
МТС Диджитал активно развивает новое продуктовое направление, сочетая в себе передовые технологии смешанной реальности и кибербезопасности. В связи с этим ищем ML-инженеров в команду. Основные задачи связаны с генерацией 3D контента на основе фото и видеоматериалов. Если вам интересно работать на стыке разных технологий и вы не боитесь изучать новые вещи, вы нам подходите. С более опытными кандидатами готовы индивидуально обсудить условия.
Коротко о нас: молодая команда, новый продукт и горящие глаза.

Что предстоит делать на этой позиции?
- Генерация 3D контента на основе фото и видеоматериалов.
- Исследование и применение новейших методов в области машинного обучения и компьютерного зрения.

Что ожидаем от кандидата?
- Желание работать на стыке разных технологий и изучать новые вещи.
- Знания и опыт в области машинного обучения, в частности NeRF, Gaussian Splatting, SfM, CV.
- Способность к быстрому освоению новых технологических подходов.

Мы предлагаем:
- Молодая и активно развивающаяся команда.
- Возможность влиять на разработку новых продуктов.
- Удобный гибридный формат работы.
- Конкурентоспособная заработная плата и индивидуальный подход к условиям сотрудничества для более опытных кандидатов.

Ответы на 10 важных вопросов:
1 Данные: Собственные датасеты
2 Железо: MTS Cloud с видеокартами v100. При расширении команды будет подключать больше
3 Масштаб влияния: Направление в рамках нового продукта
4 Уровень развития Data Science: ML — ключевое направление для создания 3D контента
5 Роль дата сайентиста: Решение конкретных задач, связанных с 3D
6 Бэкграунд у вашего руководителя linkedin
7 Как часто будут мешать работать? Синки в начале и конце недели, 2-3 часа в неделю
8 Карьерный рост: ревью раз в год, есть возможности роста, как вертикального, так и горизонтального
9 Prod/Research: Работаем на стыке технологий, проведение исследований и имплементация в продукт
10 Функция сервиса или лидера : 80/20 в сторону сервиса, но так как это исследовательская задачка, то инициатива поощряется

Присылайте резюме в TG @efy0405

Читать полностью…

Нескучный Data Science Jobs

Позиция: Разработчик-исследователь в Computer Vision
Куда: Яндекс Маркет
Формат работы: Офис, Москва, м. Аминьевская
Вилка гросс: 250 000 —‍ 450 000 ₽/мес

Что нужно делать?
-автоматизировать инвентаризацию: определять состояние паллеты по изображению, улучшать его на основе последовательности снимков;
-определять положение коробки относительно камеры на роботе: выявлять тип коробки и её 3D-положение по одному изображению;
-разрабатывать детекторы, чтобы обеспечивать складскую безопасность;
-доводить модель до продакшен-состояния, тестировать подход в бизнесовом пайплайне конкретного робота.

Требования:
-понимаете ML-методы и решали с их помощью бизнес-задачи;
-создавали нейросети для работы с изображениями, применяя PyTorch, TensorFlow или другой фреймворк;
-знаете классические алгоритмы и структуры данных;
-умеете и любите решать сложные проблемы, аргументированно отстаиваете свою точку зрения;
-решаете задачи с помощью Python.

Ответы на 10 важных вопросов:
1.Данные: Изображения и датасеты с ежедневного наката роботов на складе + доразметка данных через Толоку, для новых сложных проектов - консультации при составлении проекта.
2.Железо: Для обучения моделей (GPU/CPU), хранения данных - YTsaurus . Для разработки - выделенная виртуалка с 2x TeslaV100. Таргетовое железо на роботе - Jetson AGX Xavier 32GB. Для работы - Macbook.
3.Масштаб влияния на core-бизнес? Разработка продукта для нового направления, развитие CV в Market Robotics для анализа существующих складских процессов и их оптимизации, уменьшение CPI.
4.Уровень развития Data Science в компании? Data Science в компании выделен как одно из ключевых направлений. Для удобной работы и разработки компания создала огромную инфраструтуру и множество удобных инструментов. Рекомендательные модели используются практически во всех сервисах.
5.Роль дата сайентиста: построение моделей/подходов для разработки приложений, покрывающих бизнейс кейсы складской робототехники, выставление требований на разметку данных в Толоку, выстраивание требований к продукту (камеры/освещение)
6.Бэкграунд у вашего руководителя? linkedin
7.Как часто вам будут мешать работать? 2-3 часа организационных встреч в неделю (ежедневные митапы с командой, общие встречки-демо отдела)
8.Карьерный рост: ревью 2 раза в год
9.Prod/Research: исследование (70%) с базовым построением продуктового пайплайна (30%) для проверки работоспособности моделей. Катить модели в прод и их оптимизировать под железо будут ваши коллеги
10.Функция сервиса или лидера? 70/30 в сторону функции сервиса. Есть базовые потребности и текущие проекты, однако мы всегда поощраем инициативность в проектах и новые предложения (учитывая, что наше направление новое и мы живём в формате стартапа внутри большой компании)

Резюме присылайте ✈️ @Ya_Ntsama

Читать полностью…

Нескучный Data Science Jobs

📣 Ищем к себе в Лабораторию стажеров на NLP

Позиция: Стажер NLP (4 позиции)
Куда?: Альфа-Банк, Лаборатория Машинного Обучения, отдел NLP
Формат работы: Полная занятость на период стажировки (4-6 месяцев). Удаленная работа или возможность работы из офиса в Москве
Вилка гросс: 60К, при успешной стажировке переход на Junior: 150-200K + ежеквартальный бонус ~ 15% (от дохода за квартал)

Про нас:
Помогаем автоматически обрабатывать обращения клиентов за счет моделей для ботов в чате и голосовом канале. Снижаем рутину в работе оператора благодаря моделям для ассистента оператора и автоматической классификации обращений клиентов на 1000+ классов. Покрываем широкий класс nlp-задач: поиск инсайтов в обратной связи клиентов, классификация новостей с целью выявления событий комплаенс контроля, автоматизация обращений сотрудников в helpdesk, выявления алертов в качестве обслуживания, автоматизация контроля качества контактного центра и многие другие nlp-задачи. Команда приступает к следующему этапу развития через развитие экспертизы в LLM. Подробнее про часть задач можно узнать в треке nlp in practice.

Тебе предстоит:
- Улучшать действующие модели в непрерывном цикле, состоящем из поиска инсайтов->разметки->моделирования->аб-тестирования
- Строить RAG-пайплайны для обслуживания сотрудников и клиентов Альфы
- Дообучать LLM на банковском домене данных
- Улучшать качество и эффективность моделей ассистента оператора
- Использовать LLM для автоматизации процессов разметки данных
- Развивать комплекс моделей для улучшения качества работы операторов и менеджеров в отделениях (контроль качества, суммаризация диалогов, семантический поиск, выявление инсайтов)

Ответы на 10 важных вопросов в оригинальной статье

Резюме направляйте на почту ✉️kiizmaylov@alfabank.ru с темой «Стажер в лабораторию»,
Вопросы пишите в ✈️@IkIzma.

Читать полностью…

Нескучный Data Science Jobs

📣 Ищем к себе в Лабораторию

Позиция: Middle/Senior Data Scientist.

Куда? Альфа-Банк, Лаборатория машинного обучения, монетизация нейронных сетей.

Формат работы: Москва, м. Технопарк. Возможна полная удаленка.

Вилка (gross):

- Middle: 240-360k + ежеквартальная премия (~15% от дохода за квартал)
- Senior: 360-460k + ежеквартальная премия (~15% от дохода за квартал)

Что предстоит делать на этой позиции?

- Отвечать за полный цикл разработки нейросетевых моделей для инвестиционного бизнеса Альфа-Банка.
- Участвовать в коммуникации с бизнес-заказчиками: проводить интервью заказчика, формулировать технические и бизнес-требования к разрабатываемым моделям, презентовать результаты разработки моделей, оценивать их финансовый эффект.
- Разрабатывать дизайн экспериментов для оценки качества моделей в бизнес-процессах.
- Совместно с командой DE реализовывать ETL-процессы подготовки данных для моделей.
- Совместно с командой MLOps отвечать за внедрение моделей в систему исполнения и дальнейшую интеграцию с системами заказчика.
- Совместно с командой мониторинга ставить разработанные модели на регулярный мониторинг.
- Искать и проверять гипотезы по улучшению моделей за счет использования новых источников данных и архитектур.

Что ожидаем от кандидата:

- Промышленный опыт разработки и внедрения нейросетевых моделей.
- Знание классического ML.
- Уверенное владение ML- и DL-стеком Python: Pytorch, lightgbm/xgboost/catboost, Scikit-Learn, Pandas, Numpy.
- Умение работать с инструментами Spark, Hadoop, Hive.
- Опыт перевода бизнес-задач в термины ML.

Будет большим плюсом:

- Опыт работы в финтехе, телекоме на аналогичных позициях.
- Опыт применения моделей ML в бизнес-процессах в роли заказчика.
- Опыт работы с моделями рекомендаций.
- Опыт работы с графовыми моделями.

Ответы на 10 важных вопросов:

1. Данные: Hadoop + частично DWH. Историчность с 2016 г.

2. Железо. Разработка моделей: до 64 ядер CPU + 600 ГБ RAM + 2xNVIDIA A100 80GB. Продакшн: cистема исполнения моделей + команда MLOps + команда DE + команда поддержки. Для работы: MacBook.

3. Масштаб влияния на core-бизнес. Все линии бизнеса покрыты ML моделями, где необходимо – успешно внедрен DL.

4. Уровень развития Data Science в направлении. Все ключевые процессы покрыты моделями. Модели постоянно совершенствуются в целях максимизации финансового эффекта.

5. Роль дата сайентиста. Полное участие DS во всех этапах жизненного цикла моделей от идеи до внедрения. Плотное общение с бизнес-заказчиком начиная от постановки задачи и заканчивая деталями применения модели в процессе.

6. Бэкграунд у вашего руководителя. linkedin мини-интервью

7. Как часто вам будут мешать работать (операционный ритм встреч). 2 еженедельные встречи с командой (по ~1.5 часа).

8. Карьерный рост. Карьерная лестница в компании с утвержденным перечнем компетенций на каждой позиции. Круглые столы для рассмотрения кандидатов на продвижение 1 раз в квартал.

9. Prod/Research. Prod. Основная цель – покрытие нейросетевыми моделями core-бизнес задач Банка.

10. Функция сервиса или лидера. Сервис для внутреннего заказчика (бизнес) – 80%, поиск зон для роста компании и продвижение идей бизнесу – 20%.

Присылайте резюме в TG @Aleksey_Firstov или по почте AFirstov@alfabank.ru с темой “DS в Лабораторию”.

Читать полностью…

Нескучный Data Science Jobs

Позиция: Middle MLE
Куда? VK, юнит Почта, проект Антиспам
Формат работы: Удаленно/гибрид в РФ
Вилка (на руки): 200-300 т.р.

VK — это более 200 технологичных проектов, больше 11 000 сотрудников и миллион возможностей проявить себя. Мы делаем современные и быстрые интернет-сервисы, доступные каждому.

Проект Антиспам — это возможность реализовать передовые решения в области машинного обучения и разработки высоконагруженных систем: через нас проходят миллиарды писем и сообщений, которые необходимо обрабатывать, анализировать и делать жизнь наших пользователей ярче и удобнее. Мы выявляем спам, детектим фишинг, защищаем пользователей от взломов в почтовых ящиках.

Обязанности:
- отвечать за реализацию продуктовых задач с применением машинного обучения;
- генерировать идеи, проводить эксперименты и внедрять их в production;
- следить за прогрессом в машинном обучении и реализовывать подходящие алгоритмы.

Требования:
- отличное знание основ машинного обучения;
- 2–3 года опыта разработки с использованием Python/C++;
- уверенное знание теории вероятностей и математической статистики;
- понимание структур данных и алгоритмов;
- знание современных алгоритмов обработки естественного языка (word embeddings, LSTM, Transformers, etc.).

Условия работы:
- программа благополучия: заботимся о здоровье и хорошем самочувствии сотрудников;
- широкий пакет ДМС;
- компенсация питания в кафе и ресторанах рядом с офисами;
- компенсация спортивных активностей — 30 000 рублей в год в регионах и 35 000 рублей в год в Москве и в Санкт-Петербурге;
- 16 корпоративных команд по 12 видам спорта.

Ответы на 10 важных вопросов:
1. Данные: Десятки гигабайт для обучения моделей, сотни терабайт для поиска инсайтов. Хайлод-сетап до 1М rps
2. Железо: Кластера т4, а30 и а100 для разных сценариев обучения и инференса
3. Масштаб влияния на core-бизнес? Прямое влияние на nps/dau сервисов, всегда в поиске способов влияния на другие важные для бизнеса метрики. Кул-стори - одной из ML-фич нарастили х2 аудиторию календаря.
4. Уровень развития Data Science в компании? Компания - одна из лидеров на рынке ML, крутая экспертиза и инфраструктурная база благодаря ребятам из продуктов Почты, ВКонтакте, Дзена, Маруси, ОК (вдохновиться можно тут)
5. Роль дата сайентиста. FullStack DS роль с возможностью сужаться в отдельные наиболее интересные области (NLP Research, MLE etc)
6. Бекграунд руководителя - LinkedIn
7. Как часто вам будут мешать работать? Внимательно поддерживаем экологичный календарь разработчиков
8. Карьерный рост. Предлагаем классические треки развития в технике и техническом управлении + кастомизируем процесс PDP для комфортного развития по интересам
9. Prod или Research? 70 Prod vs 30 Research, поскольку мы во многом ориентированы на продукты, но можно двигать индивидуально
10. Сервис/Лидер. Прямое влияние на беклог всех продуктов mail.ru

Присылать резюме ✈️ @pawell

Читать полностью…

Нескучный Data Science Jobs

Позиция: Middle / Senior Data Scientist
Куда? 🅰️ Альфа-банк, Департамент продвинутой аналитики, Хаб Риски, Бизнес-процессы
Формат работы: Гибрид: Москва, м. Технопарк (>= 1 день), остальные дни удаленно.
Вилка гросс: 200-300k / 300-400k + ежеквартальный бонус ~45% от месячной зп.

Что нужно делать?
• Разрабатывать и поддерживать модели коллекшена: classic ML cls/reg/clust, Next Best Action, Propensity scoring, Uplift evaluating & learning, Active Learning, pd-scoring,
• Развивать и поддерживать внутренний фреймворк для разработки моделей.
• Генерировать и применять в моделях новые фичи на основе слабоструктурированных данных из Hadoop.
• Анализировать эффективность новых источников данных и применять их в моделях.

Требования:
• Опыт работы с данными в Python (анализ, очистка и подготовка данных, отбор и создание признаков, обучение моделей),
• Опыт написания SQL-запросов,
• Опыт работы с Hadoop (Spark, Hive, Impala),
• Опыт построения моделей машинного обучения.
• Хорошее знание теории вероятностей, математической статистики и методов машинного обучения.

Ответы на 10 важных вопросов:
1. Данные: Hadoop + внешние источники. История 2018+. Данные доступны из среды разработки моделей.
2. Железо: Разработка моделей: kuber до 64 ядер + 512 ГБ оперативы. Продакшн: cистема исполнения моделей + команда MLOps + команда DE + команда поддержки. Для работы: МакБук + удалённое рабочее место.
3. Масштаб влияния на core-бизнес? Модели - целевое ядро всех стратегий и бизнес-процессов взыскания.
4. Уровень развития Data Science в компании? Все линии бизнеса покрыты ML моделями, где необходимо - успешно внедрен DL.
5. Роль дата сайентиста: ДС-ы погружаются в бизнес-процессы, участвуют с заказчиками в постановке задачи, обрабатывают данные, подгружают готовые фичи и генерируют новые, обучают и документируют модель, подготавливают код для внедрения в прод, выполняют функцию аналитического сопровождения моделей после внедрения в прод.
6. Бэкграунд у вашего руководителя? linkedin
7. Как часто вам будут мешать работать? 2 часа организационных встреч в неделю.
8. Карьерный рост: круглый стол раз в квартал + формализованная матрица компетенций для каждой роли.
9. Prod/Research: Prod. От моделей ожидается фин. эффект (мы коммерческий банк).
10. Функция сервиса или лидера? 50:50, надо как создавать МЛ-модели, так и помогать бизнесу извлекать из них максимум пользы.

Контакты для резюме:
✉️ ankuzmin@alfabank.ru @akuzmin

Читать полностью…

Нескучный Data Science Jobs

Компания: Oxygen Technologies - oxytech.io
Позиция: Middle/Middle+ CV Machine Learning Engineer
Локация: Полная удаленка
Вилка: 250-350к руб/мес гросс, для исключительных кандидатов готовы подвинуть верхнюю границу

Кто мы?
Мы стартап в области ИИ решений для радиологии, обучаем модели и пишем алгоритмы для рентгенов, КТ и МРТ. Наши продукты уже используются в повседневной практике нескольких больниц, клиник и даже регионов.

Чем предстоит заниматься?
Созданием AI продуктов на основе нейросетей для диагностики различных заболеваний на рентгенах, КТ и МРТ снимках с 0 и до вывода в прод:
- поиск и анализ похожих решений
- анализ данных
- создание задач на разметку
- подготовка данных для разметки
- выбор архитектур нейронных сетей
- проведение экспериментов
- оценка качества работы моделей
- выкатка моделей в прод
- оптимизация моделей
- мониторинг и доработка моделей

Мы ожидаем:
- Опыт работы на должностях связанных с CV и DL 2 года+
- Опыт в задачах классификации, сегментации и детекции
- Качественный python: писать код с тайпингами и понимать для чего нужны тесты
- Хорошее знание PyTorch: умение тренировать модели и править архитектуры при необходимости
- MLOps: Git, Docker, а также знакомство с MLFlow/DVC/ClearML/etc.
- Умение работать в терминале и на серверах: bash, ssh, tmux

Большим плюсом будет:
- Опыт организации процесса разметки данных
- Опыт работы с 3D данными
- Опыт работы с медицинскими данными
- Опыт с форматами DICOM, NIfTI, Nrrd

Ответы на 10 важных вопросов:
1. Данные.
Более 1.5 млн исследований рентгенов, КТ и МРТ и с каждым днем их становится все больше. Своя команда врачей разметчиков.
2. Железо. Все обучение в облаке на V100ых.
3. Масштаб влияния на core-бизнес. Модели для радиологии - наш основная продукт.
4. Уровень развития Data Science в компании. Налажены все процессы работы с данными, разметкой, проведением экспериментов, созданием пайплайнов и выкаткой в прод.
5. Роль дата сайентиста. DS полностью отвечает за разработку конкретного продукта (например, обнаружение артроза на рентгене коленей), что включает в себя создание задач на разметку, разработку пайплайна, обучение моделей, контроль качества и дообучение.
6. Бэкграунд у вашего потенциального руководителя. LinkendIn CTO, LinkenIn CEO
7. Как часто вам будут мешать работать? Один созвон по пятницам, а остальные только по необходимости. Даже синков каждый день нет.
8. Карьерный рост. Ревью раз в год.
9. Prod / Research. Prod, но есть задачи, которые не решаются известными методами и тогда research.
10. Функция сервиса или лидера. Уклон в функцию сервиса, у нас есть долгосрочный роадмап продуктов, которых мы хотим сделать.

Контакты:
Форма для откликов: https://forms.gle/nGptYB1NnUML3yVc7
Вопросы можно писать на почту: jobs@oxytech.io

Читать полностью…

Нескучный Data Science Jobs

Позиция: Middle+
Куда? Альфа-банк, Департамент продвинутой аналитики, Хаб Риски, ЮЛ.
Формат работы: Гибрид: Москва, м. Технопарк + удаленно.
Вилка гросс: 180-280k + ежеквартальный бонус ~ 15% (от дохода за квартал).

Что нужно делать?
• Разрабатывать и поддерживать модели кредитного риска для поточного кредитования малого и среднего бизнеса (PD, LGD, EAD).
• Развивать и поддерживать внутренний фреймворк для разработки моделей.
• Генерировать и применять в моделях новые фичи на основе слабоструктурированных данных из Hadoop.
• Проводить эксперименты с нестандартными для классического скоринга подходами к моделированию.
• Анализировать эффективность новых источников данных и применять их в моделях.

Требования:
• Умение работать с данными (анализ, очистка, подготовка, отбор и создание признаков), навыки написания SQL-запросов.
• Хорошее знание теории вероятностей, математической статистики и методов машинного обучения.
• Опыт в разработке моделей машинного обучения от 1 года.
• Опыт работы c пакетами для анализа данных на Python3 (numpy, pandas, scikit-learn, xgboost, lightgbm, catboost, etc).
• Опыт работы с git.
• Желателен опыт работы с юридическими лицами, понимание, как устроена отчетность, какие модели и как можно применять для анализа компаний.

Ответы на 10 важных вопросов:
1. Данные: Hadoop + внешние источники по api. История 2017+. Данные доступны из среды разработки моделей.
2. Железо: Разработка моделей: kuber до 64 ядер + 512 ГБ оперативы. Продакшн: cистема исполнения моделей + команда MLOps. Для работы: МакБук + удалённое рабочее место.
3. Масштаб влияния на core-бизнес? Модели - ядро процесса поточного кредитования юрлиц, без них бизнес невозможен.
4. Уровень развития Data Science в компании? Все линии бизнеса покрыты ML моделями, где необходимо - успешно внедрен DL.
5. Роль дата сайентиста: ДС-ы участвуют в постановке задачи, совместно с командой рисков, прорабатывают генерацию фичей на условно подготовленных данных, обучают и документируют модель, подготавливают код для внедрения в прод, выполняют функцию аналитического сопровождения моделей после внедрения в прод.
6. Бэкграунд у вашего руководителя? linkedin
7. Как часто вам будут мешать работать? 2 часа организационных встреч в неделю.
8. Карьерный рост: круглый стол раз в квартал + формализованная матрица компетенций для каждой роли.
9. Prod/Research: Prod. От моделей требуется польза и эффективность.
10. Функция сервиса или лидера? На данном этапе сервисных функций больше.

Присылайте резюме ✈️ @alan_bzrv

Читать полностью…

Нескучный Data Science Jobs

Позиция: Аналитик-разработчик
Куда: Купер (ех СберМаркет)
Формат работы: Полная занятость. Полная удаленка, есть возможность работы из офиса в Москве, м. Новокузнецкая
Вилка (gross): 250-350к gross

Про команду: DS-команда краткосрочной эффективности операций - создавает и развивает технологии баланса спроса и предложения в сервисе (технологии мы называем сокращенно сурж). У нас уже есть написанный сервис для плановой доставки, который позволяет нам в онлайне управлять доступностью слотов для доставки, при этом есть много гипотез, которые мы хотим внедрить в алгоритм.

Что предстоит делать:
- Улучшить текущий алгоритм суржа в плановой доставке
- Разработать и внедрить сурдж слотов в быстрой доставке
- Находить точки роста в сурж-сервисах
- Разрабатывать новые решения для регулирования спроса

Что классного в вакансии:
- мы делаем алгоритмические решения для операций, а операции - сердце бизнеса Купера
- у нас нет работы в стол: мы быстро проверяем гипотезы и либо развиваем сервис, либо не работает впустую
- мы даем много творческой свободы: для нас важно найти решение бизнес-проблем

Стек
- Пишем на Python и SQL;
- Данные храним в ClickHouse, S3;
- Прототипируем в Jupyter, успешные эксперименты переносим на Airflow + Kubernetes;

Требования к кандидату
- совокупный опыт работы в дата-аналитике/продуктовой аналитике/ds от 2 лет
- уверенное владение Python и SQL;
- Git, Bash, Docker, Gitlab CI
- опыт полного цикла внедрения моделей или аналитико-разработческих систем (сбор данных, обучение и оценка модели/написание алгоритма, проведение А/Б-тестов, выкатка в прод);
- самостоятельность, инициативность и умение декомпозировать при решении задач.

Ответы на 10 важных вопросов:
1.Данные: собираем данные как в клиентской части (заказы, детализация заказов, логи в приложении), так и в курьерской части (выполенные заказы, выбранные смены, логи курьерского приложения)
2.Железо: Для работы - Macbook. ML ресурсы нашей компании находятся в Yandex.Cloud, группе ML предоставляются виртуальные машины с GPU A100/V100, ноды с GPU в клаудных кубернетисах для прогона дагов, и еще большой список нод для иной нагрузки, не вовлекающей ГПУ, такой как Trino, Airflow, прогона кастомного кода.
3.Масштаб влияния на core-бизнес? Осень-зима - самый активный период бизнеса Купера; технологии, которые разрабатывает команда ML-операций, поддерживают качество и эффективность сервиса, мы напрямую влияем на бизнес.
4.Уровень развития Data Science в компании? Data Science является ключевым направлением развития компании, команда проникла во все домены бизнеса, сейчас есть 6 команд, создающие решения для своего домен: операции, поиск, рекомендательные системы, маркетинг, контент и ads-платформа. Есть отдельная команда MLOps, развивающая платформу длдя удобной работы.
5.Роль дата сайентиста: DS в команде делает работу полного цикла: от исследования идея до выкатки в продакшн.
6.Бэкграунд у вашего руководителя? linkedin
7.Как часто вам будут мешать работать? 2-5 часов организационных встреч в неделю: командные процессы (дейли, планирования, ретро, грумминги) + синки с продуктом и вертикалью операций
8.Карьерный рост: перфоманс ревью 2 раза в год
9.Prod/Research: 50/50, поэтому позиция - аналитик-разработчик: мы ожидаем, что будут и вопросы для изучения и продумывания, также и реализация в продакшне.
10.Функция сервиса или лидера? 60/40 в сторону лидера, задачи, которые предлагаем на этой позиции, не решались, их нужно придумать и реализовать, и мы ждём самостоятельности и инициативности.

Направляйте ваши резюме ✈️@daria_lagodyuk

Читать полностью…

Нескучный Data Science Jobs

📣 Ищем к себе в 🅰️ Лабораторию стажера на NLP направление

Позиция: Стажер (NLP)
Куда: Альфа-Банк, Лаборатория машинного обучения, NLP отдел
Формат работы: Полная занятость на период стажировки (4-6 месяцев). Полная удаленка, есть возможность работы из офиса в Москве, м. Технопарк
Вилка (gross): 60k, при успешном прохождении стажировки переход на Junior: 120-240k + ежеквартальная премия ~ 15% (от дохода за квартал)

Про команду:
Помогаем автоматически обрабатывать обращения клиентов за счет моделей для ботов в чате и голосовом канале. Снижаем рутину в работе оператора благодаря моделям для ассистента оператора и автоматической классификации обращений клиентов. Покрываем широкий класс NLP-задач: поиск инсайтов в обратной связи клиентов, классификация новостей с целью выявления событий комплаенс контроля, автоматизация обращений сотрудников в техподдержку, выявления алертов в качестве обслуживания, автоматизация контроля качества контактного центра и множество других задач. Про нас можно почитать, например, тут, а также на хабре. Подробнее про часть задач можно узнать в нашем ODS-треке NLP in Practice.

Что предстоит делать:
- Улучшать действующие модели в непрерывном цикле, состоящем из поиска инсайтов->разметки->моделирования
- Дообучать LM на банковском домене данных
- Улучшать качество, эффективность и уровень автоматизации моделей классификации обращений
- Разрабатывать модели для развития сервисных процессов

Ожидаем от кандидата:
- Опыт работы с классическим ML и DL (учебные проекты/соревнования);
- Технологический стек: python, LightGBM/XGBoost/CatBoost, numpy, pandas, scikit-learn, pytorch, SQL (знание hive/impala/spark будет плюсом), git.
- Понимание основных принципов и алгоритмов классического ML и DL;
- Умение выбирать метрику под бизнес-задачу

Ответы на 10 важных вопросов в оригинальной статье

Присылайте резюме на почту ✉️ASon@alfabank.ru с темой «Стажер NLP в Лабораторию».

Читать полностью…

Нескучный Data Science Jobs

Десять важных вопросов перед трудоустройством в Data Science

🤔 Пока вы работаете в найме, вопрос построения карьерного пути остается актуальным. Не рассматриваете предложение по работе прямо сейчас? Представьте, что вам предложат лучшие условия труда, которые будут включать не только увеличение дохода в X раз, но также интересные задачи и подходящую вам рабочую атмосферу. К такому предложения, как показал опрос на Reliable ML на Data Fest 2024, сложно остаться индифферентным.

⌛️ За полтора года с момента выхода одноименной статьи, мое виденье процесса построения карьеры немного изменилось и дополнилось. Во-первых, предлагаю рассматривать ваш текущий опыт в качестве капитала и относится к выбору работы, как к инвестиции. Во-вторых, визуальный материал удалось дополнить новыми мемами.

🧠 Призываю вас забывать, что вы эксперт в Data Science, и принимать решения на основе данных в повседневной жизни. Другими словами, тщательно собирайте и анализируйте доступные данные о компании и вашем будущем руководителе, которые вы сможете найти в самой вакансии и открытых источниках, в первую очередь, на linkedin. Конечно, вакансии с ответами на все вопросы вы сможете по традиции найти в @not_boring_ds_jobs.

📹 Смотрите запись выступления по ссылке

👉 За слайдами и обсуждением доклада переходите в канал Reliable ML.

Читать полностью…

Нескучный Data Science Jobs

Позиция: Стажер дата-аналитик 6 вакасий
Компания: Х5 Group
Формат: Продолжительность стажировки 4-6 месяцев (full-time - 40 часов в неделю!)
Локация: Удаленная работа (но по желанию можно работать из офиса, г. Москва)
Вилки: Оклад 60 тыс.руб. gross
Начало стажировки: ~сентябрь 2024 г.

💡Команда ad-hoc аналитики из X5 Group (Пятерочка, Перекресток, Чижик и etc) в поисках стажеров!

🔬Почему у нас интересно?
Более 20 тысяч магазинов, 15 миллионов клиентов, петабайты данных - и все это нужно анализировать. Каждый день мы показываем, что наши супермаркеты - на самом деле цифровой проект, в котором большое место занимают Big Data и Data-Driven подход.
Мы в команде ad-hoc аналитики крутим AB-тесты в оффлайне и не только, с каждым днем все больше прилетает нестандартных задачек, в которых мы используем все свои знания (или быстро их приобретаем), а также у нас можно заниматься рисерчами!

🔭Задачи:
Чем у нас занимаются стажеры?
- Первое время проходят онбординг, запоминают имена ментора и тим-лида и погружаются в курс дела
- Сразу после этого получают свою первую настоящую боевую задачку (и НЕ страдают, так как ментор всегда под рукой) на дизайн будущего эксперимента на магазинах или лояльных клиентах или на оценку экономических эффектов от бизнес-инициатив
А если и этого мало, то вот примеры других продуктовых задач и задач на ad-hoc аналитику (в том числе и на ML), с которыми мы имеем дело:
- Разработка модели, определяющей ежедневное оптимальное количество сотрудников магазина
- Разработка алгоритма поиска комплементарных товаров и товаров-аналогов
- Кластеризация магазинов сети на группы похожих по различным параметрам
- Задача по распричиниванию случившихся списаний в магазине (сколько товара списали по причине Х)
- И многое другое

😎Ты нам подходишь:
- Если уже загуглил, что такое "ad-hoc" и понял, в чем суть
- Уверенно владеешь Python (pandas, numpy, matplotlib и весь базовый набор для аналитики данных), SQL (join'ы, оконки), знаешь статистику
- Обладаешь аналитическим складом ума, наблюдательностью и успешно практикуешь метод пристального взгляда
- Любишь мемы (желательно, но необязательно)
- Преимуществом будет владение бигдатой и ML

Что мы предлагаем:
- Помощь менторов на всем этапе стажировки
- Классный коллектив, теплая атмосфера и веселые ретро с играми и битвой мемов, а также оффлайн-тимбилдинги

Ответы на 10 важных вопросов:
1. Данные: данных петабайты, стек Hadoop, Hive, Spark.
2. Железо: под команду 2 сервера под расчеты, каждый Intel Xeon 32Core 256 GB RAM Bare Metal.
Данные храним в Hadoop.
Что касаемо ноутбуков - выдаются HP /Macbook Pro/ Dell.
3. Масштаб влияния на core-бизнес? Решаемые задачи затрагивают 20000 магазинов по всей стране.
4. Уровень развития Data Science в компании? Data Science в компании выделен как одно из ключевых направлений.
5. Роль дата сайентиста: полный цикл от понимания бизнес потребности до внедрения решений для решения ее.
6. Бэкграунд у вашего руководителя? linkedin
7. Как часто вам будут мешать работать? мешать работать не будем, 3-4 часа регулярных встреч в неделю
8. Карьерный рост: рост по результатам performance review, которые проводятся 2 раза в год.
9. Prod/Research: задача может быть любая, так что research + prod
10. Функция сервиса или лидера? На этапе стажировки 100% сервис.

Свои CV и вопросы направлять сюда: tg @didi_ulyanova

Читать полностью…

Нескучный Data Science Jobs

Позиция: Data Engineer
Куда? Teza Technologies - systematic quantitative hedge-fund
Формат работы: Гибрид - Ереван, Армения (помогаем и рефандим релокацию)
Вилка гросс: 4000 - 8 000 $

Что нужно делать?
- Своевременный онбординг и структурированных, и альтернативных данных
- Взаимодействие с квант рисерчерами и другими бизнес-партнерами для понимания их требований и будущих запросов
- Тщательное исследование данных поставщиков (в идеале - стать экспертом по их характеристикам и особенностям)
- Разработка и имплементация эффективных ETL-компонентов, с использованием передовых технологий
- Написание тестов для постоянного контроля качества
- Создание флексибельных API (согласовывая с пользователями - в нашем случае кванты и девелоперы)
- Улучшение существующей инфраструктуры данных/сервисов
- Оптимизация data IO
- Автоматизация управления хранилища данных (data storage management)

Требования:
- Знание английского - Созвоны, общение в slack и с тимлидом на английском языке
- Практические знания Python-a (+ pandas, numpy)
- Минимум год опыта в дизайне, оптимизации, деплойингe ETL/ELT и аналитических пайплайнов
- Знание C++ или Java будут огромным плюсом
- Знание AWS, Hadoop, Spark будет плюсом

Ответы на 10 важных вопросов:
1 Данные: Structured (это от биржи) и альтернативные: Data Vendors
2 Железо: In-house cloud + on-premise
3 Масштаб влияния: Все трейдинг направления + растущая команда в Ереване со свободой технически развить DE функцию локально + влиять на существующую
4 Уровень развития Data Science: компания занимается алгоритмическим трейдингом, поэтому data science и построение моделей является основной составляющей компании
5 Роль дата сайентиста: У нас роль инженера - основные задачи - как описано в посте
6 Бэкграунд у вашего руководителя - тех-лид: PhD of Math, DE pro in Financial Data - linkedin
7 Как часто будут мешать работать? Зависит: по старту - больше, это помогает лучше онбордиться. Обычно - синки раза 2 или 3 в неделю (команда + тех лид/менеджер)
8 Карьерный рост: Возможности роста и вертикальные (Локальная дата команда только собирается, Вы можете вырасти в локального Тех/Дэв Лида, Сеньор Инженера и тд), и горизонтальные (двигаться в другие команды, если есть интерес, допустим в квант девелопмент / рисёрч)
9 Prod/Research: Так как роль инженера - прода больше
10 Функция сервиса или лидера: инициатива поощряется, так как это "новая" команда для данной локации. Стать локальным тех лидом - очень вероятно.

Направляйте резюме: vgrigoryan@teza.com / @vera_grigorian

Читать полностью…

Нескучный Data Science Jobs

📣 Ищем к себе в Лабораторию

Позиция: Стажер по направлению Deep Learning

Куда? Альфа-Банк, Лаборатория машинного обучения, монетизация нейронных сетей.

Формат работы: Москва, м. Технопарк. Возможна полная удаленка.

Вилка (gross): 60К, при успешной стажировке переход на Junior: 120-240K + ежеквартальный бонус ~ 15% (от дохода за квартал)

Что предстоит делать на этой позиции?
Под руководством ментора совершенствовать наши модели глубокого обучения на последовательных данных для применения во всевозможных процессах в банке

Что ожидаем от кандидата:
- Крепкая база по DL, наличие солидных и самостоятельно выполненных проектов с использование глубокого обучения
- Умение читать и понимать статьи по DL, имплементировать наработки из статей самостоятельно
- Знание классического ML.
- Уверенное владение ML- и DL-стеком Python: Pytorch, lightgbm/xgboost/catboost, Scikit-Learn, Pandas, Numpy.
- Умение работать с инструментами Spark, Hadoop, Hive - как преимущество


Будет большим плюсом:
- Призовые места на сореврованиях
- Выполненные проекты по использованию последовательных данных
- Умение перенести архитектуру из статей в код модели

Ответы на 10 важных вопросов в оригинальной статье, бэкграунд непосредственного руководителя - linkedin мини-интервью

Подробнее о том, чем занимается наша команда, можно почитать тут
1. https://habr.com/ru/companies/alfa/articles/709416/
2. https://habr.com/ru/companies/alfa/articles/551130/
3. https://habr.com/ru/companies/alfa/articles/657577/

Присылайте резюме в TG @Aleksey_Firstov с форматом «Стажер_Фамилия_Имя»

Читать полностью…

Нескучный Data Science Jobs

Позиция: Маркетинговый аналитик
Куда? Альфа-банк, Маркетинг, Ангелы Альфы
Формат работы: Гибрид: Москва, м. Технопарк + удаленно. Но можно и полностью удалённо. Просто по вторникам мы собираемся в офисе, но это необязательно.
Вилка гросс: 120к - 160к гросс + квартальная премия 15%

Что нужно делать?
• Анализировать эффективность рекламных размещений в социальных сетях;
• Объяснять команде на цифрах, почему что-то отработало плохо, а что-то хорошо. К примеру, почему где-то нужен мем (или мэм?), а где-то нет;
• Контролировать и оценивать эффективность рекламных закупок в социальных сетях. Расскажем как мы делаем, а потом ты сам нас научишь, как лучше;
• Помогать команде следить за бюджетом: планирование, сравнение факта с планом и корректировка бюджета как в большую, так и в меньшую сторону;
• Строить дашборды. Как бы избито и шаблонно это не звучало.

Требования:
• Желателен опыт работы с анализом рекламных размещений (телеграм, ВК);
• Продвинутый уровень excel, но в основном нужны Google Sheets;
• Уметь ловко собирать понятную картину из разрозненных данных;
• Уметь без стеснения объяснять на цифрах, почему кто-то не прав;
• Превращать непонятный устный бриф в чёткий образ результата. И отработать его 😎

Ответы на 10 важных вопросов:
1. Данные: собираются автоматически из рекламных кабинетов или через мониторинговые системы, да и по классике — вручную. Однако чёткого процесса пока нет
2. Железо: выделенных серверов нет, вычисления локально 🙃 По ноуту всё обсуждаемо.
3. Масштаб влияния на core-бизнес? Мы не бизнес, а маркетинг. Делаем так, чтобы бизнес выглядел максимально sexy
4. Уровень развития Data Science в компании? В Альфе всё с этим хорошо, однако до маркетинга пока только добирается 😅
5. Роль дата сайентиста: Помогать команде принимать рациональные взвешенные и эффективные решения. А то сами знаете этих эмоциональных маркетологов
6. Бэкграунд у вашего руководителя? Руководитель не аналитик, но поможет всеми возможными ресурсами, чтобы вы развивались и росли. Главное — общаться и снесняться давать обратную связь в моменте, не копить в себе 😉 Linkedin Статья на VC, когда ещё работал в Бланке тг-канал - @ismailtot
7. Как часто вам будут мешать работать? Обсудим, как будет удобно. Никто не хочет загружать ненужными встречами. Главное — результат
8. Карьерный рост: Пересмотр зарплат раз в год, но карьерный рост зависит от уровня инициативности и амбиций.
9. Prod/Research: не применимо
10. Функция сервиса или лидера? Лидер сервиса, который из текущего хаоса построит понятную картину для команды и захочет дальше собирать команду

Направляйте ваши резюме - 📧 vpitaleva@alfabank.ru ✈️ @vwvwvwika

Читать полностью…

Нескучный Data Science Jobs

📣 Продолжаем искать к себе в Лабораторию сотрудника,

Ждём не только опытных коллег, но и сильных Junior-специалистов с опытом в DL (учебные проекты, соревнования, хакатоны тоже подойдут)

Позиция: Junior/Middle/Senior Data Scientist.

Куда? Альфа-Банк, Лаборатория машинного обучения, монетизация нейронных сетей.

Формат работы: Москва, м. Технопарк. Возможна полная удаленка.

Вилка (gross):

- Junior: 120-240k + ежеквартальная премия (~15% от дохода за квартал)
- Middle: 240-360k + ежеквартальная премия (~15% от дохода за квартал)
- Senior: 360-460k + ежеквартальная премия (~15% от дохода за квартал)

Что предстоит делать на этой позиции?

- Отвечать за полный цикл разработки нейросетевых моделей для инвестиционного бизнеса Альфа-Банка.
- Участвовать в коммуникации с бизнес-заказчиками: проводить интервью заказчика, формулировать технические и бизнес-требования к разрабатываемым моделям, презентовать результаты разработки моделей, оценивать их финансовый эффект.
- Разрабатывать дизайн экспериментов для оценки качества моделей в бизнес-процессах.
- Совместно с командой DE реализовывать ETL-процессы подготовки данных для моделей.
- Совместно с командой MLOps отвечать за внедрение моделей в систему исполнения и дальнейшую интеграцию с системами заказчика.
- Совместно с командой мониторинга ставить разработанные модели на регулярный мониторинг.
- Искать и проверять гипотезы по улучшению моделей за счет использования новых источников данных и архитектур.

Что ожидаем от кандидата:

- Промышленный опыт разработки и внедрения нейросетевых моделей (для middle и выше).
- Знание классического ML.
- Уверенное владение ML- и DL-стеком Python: Pytorch, lightgbm/xgboost/catboost, Scikit-Learn, Pandas, Numpy.
- Умение работать с инструментами Spark, Hadoop, Hive.
- Опыт перевода бизнес-задач в термины ML (для middle и выше).

Будет большим плюсом:

- Опыт работы в финтехе, телекоме на аналогичных позициях.
- Опыт применения моделей ML в бизнес-процессах в роли заказчика.
- Опыт работы с моделями рекомендаций.
- Опыт работы с графовыми моделями.

Ответы на 10 важных вопросов в оригинальной статье, бэкграунд непосредственного руководителя - linkedin мини-интервью

Присылайте резюме в TG @Aleksey_Firstov или по почте AFirstov@alfabank.ru с темой “DS в Лабораторию”.

Читать полностью…

Нескучный Data Science Jobs

Позиция: Руководитель проектов Data Science
Компания: Альфа-Банк
Локация: Москва, м. Технопарк. (гибрид, 1-2 дня в офисе)
Вилка гросс: 300-400k + ежеквартальная премия (~30% от дохода за квартал)

В Альфа-Банке уже внедрены сотни моделей машинного обучения и сорваны большинство низко-висящих фруктов. Дальнейшее развитие возможно через глубокое погружение бизнеса в нюансы Data Science. Новый член команды поможет нам сократить оставшийся гэп между бизнесом и Data Science. Эта позиция в бизнес-подразделения для специалиста, который хорошо разбирается в Data Science (но не будет делать его своими рукоми), проектном менеджменте и обладает хорошими софт скиллами.

Задачи:
⁃ Находить точки роста бизнес-процессов за счет Data Science
⁃ Выбирать продуктовые метрики, на которые будут влиять модели
⁃ Ставить задачу по разработке ML-модели вместе с командой Data Science
⁃ Контролировать соответствие разработанной модели поставленным целям
⁃ Заказывать внедрение и интеграцию модели в бизнес-процесс у смежных подразделений
⁃ Подготавливать бизнес-процесс для интеграции моделей машинного обучения
⁃ Контролировать эффективность работы модели в ПРОМ
⁃ Проверять просты гипотезы с использованием SQL и Python
⁃ Отвечать за PnL продукта и портфеля

Что ожидаем от кандидата:
⁃ Знание структуры прайсинга кредитного продукта, знание структуры PnL
⁃ Умение оцифровать потенциал продукта,
⁃ Технологический стек: Python + SQL
⁃ Глубокое понимание всех этапов жизненного цикла моделей + ML System Design
⁃ Уверенное знание теории вероятностей и математической статистики
⁃ Понимание когда DS нужно применять, а когда нет
⁃ Высокие навыки презентации результаты своей работы топ-менеджменту
⁃ Опыт ведения проектного менеджмента


1. Данные: Hadoop + частично DWH. Историчность с 2016 г.
2. Железо. Разработка моделей: до 64 ядер CPU + 600 ГБ RAM + 2xNVIDIA A100 80GB. Продакшн: cистема исполнения моделей + команда MLOps + команда DE + команда поддержки. Для работы: MacBook.
3. Масштаб влияния на core-бизнес. Все линии бизнеса покрыты ML моделями, где необходимо – успешно внедрен DL.
4. Уровень развития Data Science. Все ключевые процессы покрыты моделями. Модели постоянно совершенствуются в целях максимизации финансового эффекта.
5. Роль дата сайентиста. Не применимо для данной позиции
6. Бэкграунд у вашего руководителя. linkedin
7. Как часто вам будут мешать работать. Работа проектная => около половины времени - это встреч со смежными командами
8. Карьерный рост. Подразделение только формируется => потенциал вертикального роста
9. Prod/Research. Prod.
10. Функция сервиса или лидера. Функция лидера

Резюме направляйте на почту ✉️ rrazumovskiy@alfabank.ru с темой "Руководитель проектов Data Science"
Вопросы по вакансии в ЛС ✈️ @razumovsky_roman

Читать полностью…

Нескучный Data Science Jobs

Позиция: Стажер дата-аналитик
Компания: Х5 Group
Формат: Продолжительность стажировки 4-6 месяцев (full-time!)
Локация: Удаленная работа (но по желанию можно работать из офиса, г. Москва)
Вилки: Оклад 60 тыс.руб. gross
Начало стажировки: ~июнь 2024 г.

Команда ad-hoc аналитики из X5 Group (Пятерочка, Перекресток, Чижик и etc) в поисках стажеров!

Почему у нас интересно?
Более 20 тысяч магазинов, 15 миллионов клиентов, петабайты данных - и все это нужно анализировать. Каждый день мы показываем, что наши супермаркеты - на самом деле цифровой проект, в котором большое место занимают Big Data и Data-Driven подход.
Мы в команде ad-hoc аналитики крутим AB-тесты в оффлайне и не только, с каждым днем все больше прилетает нестандартных задачек, в которых мы используем все свои знания (или быстро их приобретаем), а также у нас можно заниматься рисерчами!

Задачи:
Чем у нас занимаются стажеры?
- Первое время проходят онбординг, запоминают имена ментора и тим-лида и погружаются в курс дела
- Сразу после этого получают свою первую настоящую боевую задачку (и НЕ страдают, так как ментор всегда под рукой) на дизайн будущего эксперимента на магазинах или лояльных клиентах или на оценку экономических эффектов от бизнес-инициатив
А если и этого мало, то вот примеры других продуктовых задач и задач на ad-hoc аналитику (в том числе и на ML), с которыми мы имеем дело:
- Разработка модели, определяющей ежедневное оптимальное количество сотрудников магазина
- Разработка алгоритма поиска комплементарных товаров и товаров-аналогов
- Кластеризация магазинов сети на группы похожих по различным параметрам
- Задача по распричиниванию случившихся списаний в магазине (сколько товара списали по причине Х)
- И многое другое

Ты нам подходишь:
- Если уже загуглил, что такое "ad-hoc" и понял, в чем суть
- Уверенно владеешь Python (pandas, numpy, matplotlib и весь базовый набор для аналитики данных), SQL (join'ы, оконки), знаешь статистику
- Обладаешь аналитическим складом ума, наблюдательностью и успешно практикуешь метод пристального взгляда
- Любишь мемы (желательно, но необязательно)
- Преимуществом будет владение бигдатой и ML

Что мы предлагаем:
- Помощь менторов на всем этапе стажировки
- Классный коллектив, теплая атмосфера и веселые ретро с играми и битвой мемов, а также оффлайн-тимбилдинги

Ответы на 10 важных вопросов :
1. Данные: данных петабайты, стек Hadoop, Hive, Spark.
2. Железо: под команду 2 сервера под расчеты, каждый Intel Xeon 32Core 256 GB RAM Bare Metal.
Данные храним в Hadoop.
Что касаемо ноутбуков - выдаются Macbook Pro или Dell.
3. Масштаб влияния на core-бизнес? Решаемые задачи затрагивают 20000 магазинов по всей стране.
4. Уровень развития Data Science в компании? Data Science в компании выделен как одно из ключевых направлений.
5. Роль дата сайентиста: полный цикл от понимания бизнес потребности до внедрения решений для решения ее.
6. Бэкграунд у вашего руководителя? linkedin
7. Как часто вам будут мешать работать? мешать работать не будем, 3-4 часа регулярных встреч в неделю
8. Карьерный рост: рост по результатам performance review, которые проводятся 2 раза в год.
9. Prod/Research: задача может быть любая, так что research + prod
10. Функция сервиса или лидера? На этапе стажировки 100% сервис.

Свои CV и вопросы направлять сюда: ✈️ @didi_ulyanova

Читать полностью…

Нескучный Data Science Jobs

Позиция: Middle DA/DS
Куда? X5 Group
Формат работы: Можно работать как удаленно, так и гибридно или из офиса - Москва(м Волгоградский проспект или м Добрынинская)
Вилка: 250-400 тыс. руб (gross)

Что нужно делать?

1. Основная задача состоит в оценке эффективности IT-продуктов (в рамках проекта "Продуктовый Градусник"). Продуктов достаточно много, поэтому оценка качества продукта в различных аспектах - очень важная стратегическая задача.

Типичная оценка состоит из следующих этапов:
- проведение интервью с product owner, чтобы:
а) разобраться в бизнес-процессах, на которые влияет продукт (логика формирования цен, выбор товаров для промо, распределение заказов в доставке, ...)
б) определить бизнес-цели продукта (влияние на РТО, доступность, валовую маржу, ...)
в) собрать иные артефакты и информацию по продукту (продуктовые метрики, отчеты по фин. показателям, качество работы самой команды и т.д.)
- выявить точки роста продуктов
- помочь с составлением иерархии метрик, выявлением NSM метрики
- помочь с построением продуктовых гипотез и форматом их тестирования
- подготовить отчет по результатам оценки с рекомендациями и подробными комментариями.


2. Также есть возможность помимо основного проекта "Продуктовый градусник" решать ad-hoc задачи.
Типичная ad-hoc задача состоит из следующих этапов:
- обсуждение с заказчиком его потребностей к аналитике, совместная работа над выявлением точек роста в его задаче и методологии решения.
- собрать нужные для решения задачи данные из целевых источников (в основном Hadoop) и провести всю необходимую аналитику (это может быть как ML-бейзлайн, результат A/B теста, MVP веб-сервиса, дашборд и т.д.)
- формируете и презентуете заказчику результат вашей работы (например, в виде презентации или как договорились с заказчиком)

Примеры ad-hoc задач:
- Разработка модели, определяющей ежедневное оптимальное количество сотрудников магазина
- Разработка алгоритма поиска комплементарных товаров и товаров-аналогов
- Кластеризация магазинов сети на группы похожих по различным параметрам


Требования:
0. Автономность
1. Python, SQL, желательно распределенные вычисления (Hadoop/Spark)
2. ML, статистика
3. Умение общаться, выражать и доносить свои мысли
4. Будет большим плюсом, если умеете в продуктовую аналитику (в том числе хорошо понимаете подходы к построению иерархии метрик)

Мы предлагаем
- Возможность работать удалённо или ездить в офис на м. Волгоградский проспект или м. Добрынинская.
- Гибкий график работы (с 8/9/10/11 утра).
- Развитую систему компенсаций и льгот.
- Широкий пакет ДМС (включая выезд за рубеж и стоматологию), страхование жизни и здоровья.
- Программу привилегий Prime-zone (скидки на товары и услуги и специальные предложения от компаний-партнёров).
- Материальную помощь сотрудникам, попавшим в сложную жизненную ситуацию.

Ответы на 10 важных вопросов :
1. Данные: данных петабайты, стек Hadoop, Hive, Spark.
2. Железо: под команду 2 сервера под расчеты, каждый Intel Xeon 32Core 256 GB RAM Bare Metal.
Данные храним в Hadoop.
Что касаемо ноутбуков - выдаются Macbook Pro или Dell.
3. Масштаб влияния на core-бизнес? Продуктовый Градусник покрывает большинство продуктов X5. Решаемые ad-hoc задачи затрагивают 20000 магазинов по всей стране.
4. Уровень развития Data Science в компании? Data Science в компании выделен как одно из ключевых направлений.
5. Роль дата сайентиста: полный цикл от понимания бизнес потребности до внедрения решений для решения ее.
6. Бэкграунд у вашего руководителя? linkedin
7. Как часто вам будут мешать работать? мешать работать не будем, 2-3 часа регулярных встреч в неделю
8. Карьерный рост: рост по результатам performance review, которые проводятся 2 раза в год.
9. Prod/Research: В рамках Градусника скорее Research
ad-hoc задача может быть любая, так что research + prod
10. Функция сервиса или лидера? Поначалу скорее сервис.

Присылать резюме: ✈️ - @summervent

Читать полностью…

Нескучный Data Science Jobs

Позиция: Junior+\Middle Data Scientist
Куда? Хантфлоу, Data Science команда.
Формат работы: Удаленно в РФ или Москва (с возможностью посещать офис, м. Дмитровская). Возможно оформление не в РФ с работой по всему миру.
Вилка (на руки): Junior+: 140-200 тыс. руб. / Middle: 200-300 тыс. руб. (или эквивалент в евро)

Описание вакансии
Хантфлоу — это компания в области HRTech, предоставляющая передовые решения для автоматизации рекрутинга. Наш продукт помогает компаниям эффективно закрывать вакансии, сокращая время на поиск и отбор кандидатов. Подробнее о компании вы можете узнать на сайте.
Мы находимся на пороге нового этапа развития, где Data Science играет ключевую роль. В нашем арсенале уже есть MVP пилотного сервиса для рекомендации кандидатов на вакансии, основанный на исторических данных о движении кандидатов по воронке подбора. Помимо развития этого сервиса, также стоит множество вызовов и задач по разработке и усовершенствованию функционала с применением Data Science.

Что нужно делать?
- Работать с большим объемом данных о движении кандидатов
- Разрабатывать и внедрять модели машинного обучения на табличных и текстовых данных
- Тесно взаимодействовать с командой разработчиков для интеграции ваших решений в продукт

Различие в позициях Junior+\Middle предполагает разный уровень ответственности. Middle самостоятельно лидирует свою задачу.

Требования:
1. Понимание основных принципов и алгоритмов классического ML, DL и NLP в частности
2. Практический опыт работы с NLP
3. Опыт внедрения ml-моделей в продакшн
4. Умение выбирать метрику под бизнес-задачу
5. Технологический стек: python: pytorch, LightGBM/XGBoost/CatBoost, sklearn, pandas, numpy + sql + git + docker

Будет плюсом: опыт работы с задачами ранжирования и/или рекомендаций

Условия:
1. Рабочий mac
2. Профессиональное обучение и повышение квалификации за счет компании
3. Расширенная программа ДМС со стоматологией, вызовом врача на дома и полисом путешественника — после испытательного срока
4. Ежемесячная компенсация оплаты интернета при работе из дома, или проезда при работе из офиса
5. 14 дней «без больничного» в год.

Ответы на 10 важных вопросов:
1. Данные:
- Более 40 млн кандидатов в базе
- Более 100 тыс. вакансий
- Более 300 млн действий по кандидатам
- 8 лет истории
2. Железо:
- Аренда облачных серверов с GPU
- Рабочий MacBook Pro
3. Масштаб влияния:
Для компании Data Science — «The Next Big Thing» и ключевое направление в развитии компании. Сейчас направление только зарождается, поэтому есть возможность сыграть в нем ключевую роль.
4. Уровень развития Data Science в компании:
Внедрен только MVP сервиса рекомендации кандидатов на вакансию. Предстоит развитие сервиса и множество других задач по улучшению функциональности продукта.
5. Чем занимаются дата сайентисты в компании:
Полный цикл от постановки задач до эксплуатации моделей/сервисов на продакшне
6. Какой бэкграунд у вашего потенциального руководителя:
linkedin
7. Как часто вам будут мешать работать:
1 час еженедельного синка по задачам
8. Карьерный рост:
Пока нет выработанного процесса. В процессе разработка более четкой схемы грейдирования
9. Research/Prod:
На текущем этапе в первую очередь Prod
10. Функция сервиса или лидера?
30/70 - лидер/сервис. Больше сервисных функций, но строгого беклога задач пока нет, так как направление только зарождается. Любая инициатива будет приветствоваться.

✉️ Резюме отправляйте на почту: koptelov@huntflow.ru
✈️ По вопросам в тг: @meacca

Читать полностью…

Нескучный Data Science Jobs

Позиция: Middle Data Scientist
Куда: Озон Fintech, Отдел моделирования банковских продуктов, группа моделирования продуктов B2C.
Формат работы: Гибрид: Москва, м. Международная/Деловой центр/Выставочная + удаленно.
Вилка гросс: 200-300k гросс + премии 1 оклад каждые пол года

Что нужно делать?
- Создавать и поддерживать ML-модели для работы с розничными клиентами
- Развивать внутренние инструменты для построения моделей
- Генерировать и применять в моделях новые фичи
- Участвовать в постановке задачи, выбирать приоритетные направления для моделирования
- Анализировать влияние моделей на бизнес
- Организовывать и дорабатывать мониторинг

Требования:
- Умение работать с данными (анализ, очистка, подготовка, отбор и создание признаков), навыки написания SQL-запросов и Pyspark-пайплайнов
- Хорошее знание теории вероятности, математической статистики и методов машинного обучения
- Опыт в разработке моделей машинного обучения от 1 года
- Опыт работы c пакетами для анализа данных на Python3 (numpy, pandas, scikit-learn, xgboost, lightgbm, catboost, etc)
- Опыт работы с git
- Опыт работы с Airflow

Ответы на 10 важных вопросов:
1. Данные: обилие данных маркетплейса Озон
2. Железо: Разработка моделей: kuber с ресурсами под потребность. Продакшн: ML Platorm для быстрого внедрения моделей. MacBook для работы
3. Масштаб влияния на core-бизнес? Модели - основа кредитного бизнеса и важная оставляющая большинства продуктов компании
4. Уровень развития Data Science в компании? Высокая степень зрелости. Роль дата сайентиста: ДС-ы участвуют в постановке задачи совместно с заказчиками, обучают и документируют модель, подготавливают код для внедрения в прод, сопровождают модели после внедрения
6. Бэкграунд у вашего руководителя? linkedin
7. Как часто вам будут мешать работать? 2 часа организационных встреч в неделю.
8. Карьерный рост: Ревью раз в пол года.
9. Prod/Research: Prod. Модели должны приносить пользу бизнесу
10. Функция сервиса или лидера? Больше функция лидера, нужно помогать бизнесу находить точки роста

📧 akvolkov@ozon.ru @v0lkoff

Читать полностью…

Нескучный Data Science Jobs

Позиция: Middle/Senior Data Scientist
Куда? Альфа-банк, Департамент продвинутой аналитики, Хаб Юридические Лица
Формат работы: Гибрид: Москва, м. Технопарк + удаленно
Вилка гросс:
• Middle: 180-270k + ежеквартальная премия ~ 15% (от дохода за квартал)
• Senior: 250-380k + ежеквартальная премия

Что делать на этой позиции?
• Разрабатывать, поддерживать и автоматизировать модели машинного обучения для Юридических Лиц (Малый, Средний и Крупный корпоративный бизнес)
• Совместно с бизнес-командами участвовать в анализе результатов работы моделей, генерировать новые идеи по применению моделей в бизнес-процессах, оценивать финансовый эффект от моделей
• Разрабатывать дизайн экспериментов для оценки качества моделей в бизнес-процессах
• Искать и тестировать новые источники данных для разработки моделей, генерировать фичи для разработки, продукционализировать источники совместно с командой дата инженеров
• Выстраивать мониторинг действующих моделей
• Автоматизировать имеющиеся подходы к разработке, разрабатывать алгоритмы AutoML

Решаемые задачи:
• Propensity, X-sell, Cross-sell, Churn, NBO, channel distribution, Marketing Optimization
• CVM, CLTV
• Транзакционное/поведенческое моделирование (поиск поведенческих паттернов)
• Прогноз фин. показателей, кошельки ЮЛ, сегментация рынка
• Графовая аналитика, поиск ЛПР
• Ресурсно-оптимизационные задачи

Что ожидаем от кандидата:
• Уверенный использование технологического стека: python, LightGBM/XGBoost/CatBoost, sklearn, pandas, numpy + sql + git
• Spark, Hadoop, Hive
• Знание классического ML
• Опыт перевода бизнес-задач в термины ML

Будет большим плюсом:
• Опыт работы в финтехе, телекоме на аналогичных позициях
• Знание и понимание особенностей корпоративного банковского бизнеса: специфика банковских продуктов, каналы продаж, управление воронкой и пр.
• Опыт применения моделей ML в бизнес-процессах в роли заказчика

Ответы на 10 важных вопросов:
1. Данные: Hadoop + частично DWH. Историчность с 2016г.
2. Железо: Мак + удаленка. Среда разработки - 64 ядра, RAM 512 ГБ. Инференс – универсальное общебанковское решение и команда MLOps.
3. Масштаб влияния на core-бизнес? Подтвержденный финансовый эффект от применения моделей Хаба Юридических Лиц в бизнесе в 2022г. составил величину с 9 нулями (в руб.).
4. Уровень развития Data Science в направлении? Все ключевые процессы покрыты моделями. Модели постоянно совершенствуются в целях максимизации финансового эффекта.
5. Роль дата сайентиста: полное участие DS во всех этапах жизненного цикла моделей от идеи до внедрения. Плотное общение с бизнес-заказчиком начиная от постановки задачи и заканчивая деталями применения модели в процессе.
6. Бэкграунд у вашего руководителя? Ссылка на LinkedIn.
7. Как часто вам будут мешать работать (операционный ритм встреч)? Для миддл уровня – ежедневные дейли + 1-2 ч организационных встреч с заказчиком. Для сеньор уровня – ежедневные дейли + 3-4 ч организационных встреч с заказчиком.
8. Карьерный рост: карьерная лестница в компании с утвержденным перечнем компетенций на каждой позиции. Круглые столы для рассмотрения кандидатов на продвижение 1р. в квартал.
9. Prod/Research: Prod. Основная цель – выполнение бизнес-КПЭ по росту продаж, активной базы, финансовому эффекту.
10. Функция сервиса или лидера? Сервис для внутреннего заказчика (бизнес), что однако дает возможности для творческого решения бизнес-задач различными техническими способами.

Присылайте резюме в ТГ или по почте с пометкой “Резюме DS”.
@druzanov
Druzanov@alfabank.ru

Читать полностью…

Нескучный Data Science Jobs

Позиция: Middle/Senior Data Scientist
Куда? Альфа-Банк, Департамент продвинутой аналитики, xaб Розничный бизнес
Формат работы: Гибрид - Москва, м. Технопарк + удаленно.
Вилка гросс: 200-300/300-400K + ежеквартальный бонус ~ 15% (от дохода за квартал).

Что нужно делать?
Поддержка моделей в проекте категорийный кэшбэк
Разработка новых моделей (прогноз трат в категориях, интерес клиентов, оптимизатор выбора категорий и тд). Табличные данные.
Вывод моделей в продакшн
Развивать и поддерживать внутренний фреймворк для разработки моделей.
Общаться с product owner’ами и выявлять потребности бизнеса
Проводить пилоты гипотез

Требования:
1. Общий опыт работы в этом направлении – от 2 лет.
2. Hard skills: Python, bash, git, SQL, Hadoop; BitBucket (Git), JIRA и Confluence.
3. Умение выбирать метрику под бизнес-задачу
4. Опыт написания кода в прод
5. Опыт проведение АБ тестов

Ответы на 10 важных вопросов:
1. Данные: Обычно - Hadoop (все данные Альфа-Банка) + внешние источники по API. Часть данных может быть в Oracle
2. Железо:  kuber до 64 ядер + 512 ГБ оперативы. Хадуп - 6TB, 1000+ ядер. Продакшн: cистема исполнения моделей + команда MLOps. Для работы: МакБук + удалённое рабочее место.
3. Масштаб влияния на core-бизнес? Модели - ядро большинства банковских процессов, в частности, категорийный кэшбэк- один самых значимых проектов, с ежемесячной отдачей клиентов.
4. Уровень развития Data Science в компании? Все линии бизнеса покрыты ML моделями, где необходимо - успешно внедрен DL.
5. Роль: см. что нужно делать (выше).
6. Бэкграунд у вашего руководителя? linkedin
7. Как часто вам будут мешать работать?  4-5 часов организационных встреч в неделю.
8. Карьерный рост: формализована матрица компетенций. Ежеквартально происходят «круглые столы» с пересмотром и защитой
9. Prod/Research: на начальном этапе Prod – 90% (необходим вывод процесса в прод), Research – 10% (инвестиция в развитие методологии). В целевом сценарии, после создания и роста команды, пропорция обратная.
10. Функция сервиса или лидера? 90/10.

Присылать резюме на nakomarova@alfabank.ru с темой письма: «Резюме DataScientist".

Читать полностью…
Subscribe to a channel