not_boring_ds_jobs | Unsorted

Telegram-канал not_boring_ds_jobs - Нескучный Data Science Jobs

6129

Нескучные позиции в Data Science

Subscribe to a channel

Нескучный Data Science Jobs

Позиция: Миддл/Сеньор по CV
Локация: Москва (м. Пакрк Культуры), есть гибрид или полная удалёнка, но желательно тоже в Москве, чтобы обкатывать фичи на роботе в парках
Вилка Net: 200-300к - миддл, 300к-400к - сеньор. Для особых кандидатов можем дополнительно обсудить вилку

О проекте:

Наш проект - сочетание робототехники и передовых технологий. У нас уже есть работающий робот-уборщик, но нам нужен профессионал, способный создать алгоритмы компьютерного зрения, которые улучшат его производительность и безопасность. Наша миссия - разработать и интегрировать как классические, так и передовые нейросетевые алгоритмы для обеспечения точной навигации и обнаружения препятствий.

Технологический стек:

- языки программирования: Python, C++;
- фреймворки для глубокого обучения и внедрения в робота: PyTorch, ROS2 и др;
- библиотеки компьютерного зрения, такие как OpenCV;
- DevOps часть: git, docker.

Чем предстоит заниматься:

- разработка, тестирование и интеграция алгоритмов компьютерного зрения в 2D и 3D для точной локализации роботов и обнаружения движущихся объектов и статических преград;
- создание и проверка гипотез с использованием имеющихся данных и разработка новых метрик для оценки результатов;
- разработка понятных и эффективных моделей, описывающих окружающую среду для наших беспилотных роботов;
- создание и оптимизация пайплайнов обработки данных для обучения нейронных сетей и оценки их производительности.

Кто наш кандидат:

- вы глубоко разбираетесь в компьютерном зрении и успешно применяли его в практических проектах;
- знакомы с линейной алгеброй, теорией вероятностей, дискретной математикой и оптимизацией;
- умеете решать сложные задачи, используя Deep Learning;
- программируете на Python или C++;
- имеете опыт работы с PyTorch или аналогичными фреймворками;
- умеете объяснять и защищать свои решения, готовы к конструктивной критике и хорошо работаете в команде;
- обладаете ответственностью и организованностью.

Мы предлагаем:

- участие в сильной команде, где есть возможность профессионального роста;
- возможность влиять на процесс и результаты проекта и тестировать свои разработки на реальном роботе, который уже работает в городских парках;
- конкурентную заработную плату и ее пересмотр минимум раз в год;
- гибкое начало и окончание рабочего дня, возможность удаленной работы на территории РФ;
- тихий и просторный офис в центре Москвы в двух минутах пешком от м. Парк Культуры;
- мощную технику для работы в офисе и дома;
- отсутствие бюрократии и горизонтальную структуру без десятка начальников;
- любые курсы и конференции по специальности;
- компания имеет аккредитацию Минцифры, ее продукты входят в реестр отечественного ПО.

Ответы на 10 важных вопросов:
1. Данные:
• Ежедневно собираются от 3 часов видеоданных (+ состояния техники RosBags) с камер роботов в таких парках, как Сокольники, им. Горького и другие.
2. Железо:
• У каждого члена команды nvidia 4060 + отдельный сервер со стеком 4060
• Рабочий ноут по требованию сотрудника
3. Масштаб влияния: разработка беспилотной техники Москвы для уборки парков
4. Какой сейчас уровень развития Data Science в компании: активно начинает развиваться
5. Чем именно занимаются дата сайентисты в компании: полный цикл от постановки задач до эксплуатации моделей/сервисов на продакшне
6. Какой бэкграунд у вашего потенциального руководителя: co-founder
7. Как часто вам будут мешать работать: 20 минут в день на синхронизацию всех задач с коллегами
8. Карьерный рост: да, построение направления полностью в ваших руках
9. Research/Prod: Prod 60% + Research (как внедряемые технологии) 40%
10. Функция сервиса или лидера? Лидера 50% + Сервиса 50%
Контакты для резюме ✈️ @StonedTwice (Dev)

Читать полностью…

Нескучный Data Science Jobs

Позиция: Стажер дата-аналитик
Компания: Х5 Group
Формат: Продолжительность стажировки 4-6 месяцев (full-time/part-time)
Локация: Удаленная работа (но по желанию можно работать из офиса, г. Москва)
Вилки: Оклад 60 тыс.руб. gross для full-time/ 30 тыс.руб. для part-time
Начало стажировки: январь 2024 г.

Команда ad-hoc аналитики из X5 Group (Пятерочка, Перекресток, Чижик и etc) в поисках стажеров!

Почему у нас интересно?
Более 20 тысяч магазинов, 15 миллионов клиентов, петабайты данных - и все это нужно анализировать. Каждый день мы показываем, что наши супермаркеты - на самом деле цифровой проект, в котором большое место занимают Big Data и Data-Driven подход.
Мы в команде ad-hoc аналитики крутим AB-тесты в оффлайне и не только, с каждым днем все больше прилетает нестандартных задачек, в которых мы используем все свои знания (или быстро их приобретаем), а также у нас можно заниматься рисерчами!

Задачи:
Чем у нас занимаются стажеры?
- Первое время проходят онбординг, запоминают имена ментора и тим-лида и погружаются в курс дела
- Сразу после этого получают свою первую настоящую боевую задачку (и НЕ страдают, так как ментор всегда под рукой) на дизайн будущего эксперимента на магазинах или лояльных клиентах или на оценку экономических эффектов от бизнес-инициатив
А если и этого мало, то вот примеры других продуктовых задач и задач на ad-hoc аналитику (в том числе и на ML), с которыми мы имеем дело:
- Разработка модели, определяющей ежедневное оптимальное количество сотрудников магазина
- Разработка алгоритма поиска комплементарных товаров и товаров-аналогов
- Кластеризация магазинов сети на группы похожих по различным параметрам
- Задача по распричиниванию случившихся списаний в магазине (сколько товара списали по причине Х)
- И многое другое

Ты нам подходишь:
- Если уже загуглил, что такое "ad-hoc" и понял, в чем суть
- Уверенно владеешь Python (pandas, numpy, matplotlib и весь базовый набор для аналитики данных), SQL (join'ы, оконки), знаешь статистику
- Обладаешь аналитическим складом ума, наблюдательностью и успешно практикуешь метод пристального взгляда
- Любишь мемы (желательно, но необязательно)
- Преимуществом будет владение бигдатой и ML

Что мы предлагаем:
- Помощь менторов на всем этапе стажировки
- Классный коллектив, теплая атмосфера и веселые ретро с играми и битвой мемов, а также оффлайн-тимбилдинги

Если тебе интересно развиваться в области аналитики данных, смело присоединяйся к нам!

Свои CV и вопросы направлять сюда: tg @didi_ulyanova

Ответы на 10 важных вопросов :
1. Данные: данных петабайты, стек Hadoop, Hive, Spark.
2. Железо: под команду 2 сервера под расчеты, каждый Intel Xeon 32Core 256 GB RAM Bare Metal.
Данные храним в Hadoop.
Что касаемо ноутбуков - выдаются Macbook Pro или Dell.
3. Масштаб влияния на core-бизнес? Решаемые задачи затрагивают 20000 магазинов по всей стране.
4. Уровень развития Data Science в компании? Data Science в компании выделен как одно из ключевых направлений.
5. Роль дата сайентиста: полный цикл от понимания бизнес потребности до внедрения решений для решения ее.
6. Бэкграунд у вашего руководителя? linkedin
7. Как часто вам будут мешать работать? мешать работать не будем, 3-4 часа регулярных встреч в неделю
8. Карьерный рост: рост по результатам performance review, которые проводятся 2 раза в год.
9. Prod/Research: задача может быть любая, так что research + prod
10. Функция сервиса или лидера? На этапе стажировки 100% сервис.

Читать полностью…

Нескучный Data Science Jobs

🚀 Появилась уникальная возможность построить Data Science команду с нуля!
🔊 Общался лично с нанимающим менеджером, вакансия 🔥, заслуживает мою личную рекомендацию!

Вакансия: Data Science Team Lead / Senior Engineer
Компания: Хантфлоу (https://huntflow.ru)
Зарплатная вилка: 400 000 – 500 000 руб на руки
Формат работы: полная удаленка или гибрид в офисе (Москва, м. Дмитровская)

Что нужно делать?
Запустить новое направления по реализации продуктов на основе данных. Пилотный продукт — сервис рекомендаций кандидатов на вакансии внутри Хантфлоу на основе исторических данных о движении кандидатов по воронке подбора. Первоначальный запуск MVP-продукта нужно будет осуществить самостоятельно, а затем собрать команду для превращения MVP в полноценное продуктовое решение и дальнейшее развитие этого направления. После успешного запуска продукта компания будет готова улучшать и другие свои процессы за счет Data Science.

Кого ищем?
Играющего Data Science Team Lead или опытного Senior Data Science инженера с желанием развиваться в сторону построения и управления командой.

Требования
• Понимание основных принципов и алгоритмов классического ML, DL и NLP
• Технологический стек: python + pytorch:, LightGBM/XGBoost/CatBoost, sklearn, pandas, numpy + sql + git + docker
• Обширный опыт постановки задач и их внедрения в продакшн
• Опыт работы в продуктовых компаниях


Ответы на 10 важных вопросов:
1. Данные:
• Более 40 млн кандидатов в базе
• Более 100 тыс. вакансий
• Более 300 млн действий по кандидатам
• 8 лет истории
2. Железо:
• Аренда серверов с GPU в Selectel
• Рабочий MacBook Pro с необходимой памятью/процессором
3. Масштаб влияния: для компании это «The Next Big Thing» и ключевое направление в развитии компании
4. Какой сейчас уровень развития Data Science в компании: направления нет, его нужно запустить и построить
5. Чем именно занимаются дата сайентисты в компании: полный цикл от постановки задач до эксплуатации моделей/сервисов на продакшне
6. Какой бэкграунд у вашего потенциального руководителя: linkedin
7. Как часто вам будут мешать работать: пару часов в неделю
8. Карьерный рост: да, построение направления полностью в ваших руках
9. Research/Prod: преимущественно Prod
10. Функция сервиса или лидера? в большей степени функция лидера

Откликнуться: https://huntflow.ru/career/vacancy/data-science-team-lead
Позадавать вопросы напрямую: ✈️ @glibin

Читать полностью…

Нескучный Data Science Jobs

Позиция: Junior+
Куда? Альфа-банк🅰️, Департамент продвинутой аналитики, Хаб Риски, Бизнес-процессы
Формат работы: Гибрид: Москва, м. Технопарк (>= 1 день) + удаленно.
Вилка гросс: 100-150k + ежеквартальный бонус ~ 15% (от дохода за квартал).

Что нужно делать?
• Разрабатывать и поддерживать антифрод модели и модели верификации,
• Развивать и поддерживать внутренний фреймворк для разработки моделей.
• Генерировать и применять в моделях новые фичи на основе слабоструктурированных данных из Hadoop.
• Анализировать эффективность новых источников данных и применять их в моделях.

Требования:
• Умение работать с данными в Python (анализ, очистка, подготовка, отбор и создание признаков),
• Опыт написания SQL-запросов,
• Опыт построения моделей машинного обучения.
• Хорошее знание теории вероятностей, математической статистики и методов машинного обучения.

Ответы на 10 важных вопросов:
1. Данные: Hadoop + внешние источники. История 2020+. Данные доступны из среды разработки моделей.
2. Железо: Разработка моделей: kuber до 64 ядер + 512 ГБ оперативы. Продакшн: cистема исполнения моделей + команда MLOps. Для работы: МакБук + удалённое рабочее место.
3. Масштаб влияния на core-бизнес? Модели - ядро процесса поточного кредитования как физ. лиц, так и юр. лиц
4. Уровень развития Data Science в компании? Все линии бизнеса покрыты ML моделями, где необходимо - успешно внедрен DL.
5. Роль дата сайентиста: ДС-ы погружаются в бизнес-процессы, участвуют с заказчиками в постановке задачи, обрабатывают данные, подгружают готовые фичи и генерируют новые, обучают и документируют модель, подготавливают код для внедрения в прод, выполняют функцию аналитического сопровождения моделей после внедрения в прод.
6. Бэкграунд у вашего руководителя? linkedin
7. Как часто вам будут мешать работать? 2 часа организационных встреч в неделю.
8. Карьерный рост: круглый стол раз в квартал + формализованная матрица компетенций для каждой роли.
9. Prod/Research: Prod. От моделей требуется фин. эффект (коммерческий банк).
10. Функция сервиса или лидера? На данном этапе сервисных функций больше.

Контакты для резюме:
- tg:  @YOlgaVo
- email: oyvolodina@alfabank.ru

Читать полностью…

Нескучный Data Science Jobs

Привет! Ищу руководителя в команду оценки Авито 💚

Компания: Авито 💚
Вакансия: ML Tech Lead
Зарплатная вилка: 400 000 – 600 000р гросс + 15% премии
Стек: Классический ML, CV, NLP
Формат работы: офис (Москва, м. Белорусская), гибрид или полная удалёнка


Что такое оценка на Авито и зачем она нужна?

Команда IMV (instant market value) разрабатывает системы оценки товаров, продающихся на Авито. Каждый день модели imv оценивают автомобили, квартиры, телефоны, планшеты, телевизоры, стоимость услуг и прочее. Эти оценки помогают покупателям ориентироваться в ценах, проявлять бдительность, когда она занижена, и просить обосновать оценку выше рынка. Продавцы же с помощью оценки могут продавать быстрее, выставляя цену в рыночном диапазоне или чуть ниже, и не упускать прибыль, если ситуация изменилась и цены выросли.
С помощью этих моделей Авито создаёт транзакционные продукты (например 1, 2), использует эти модели в модерации, помогает профессиональным продавцам повышать прибыльность своего бизнеса. Результат оценки каждый день видят миллионы пользователей, большая часть которых доверяет и ориентируется на неё. Наша цель – иметь на Авито самую точную оценку всех товаров.
Для этого при оценке мы стараемся учитывать как можно больше данных и на текущий момент оценка производится с использованием анализа изображений, текста и табличных данных. Модель оценки должна не только точно предсказывать цену, но и быстро адаптироваться к изменениям рынка и иметь возможность интерпретировать свои предсказания.

Почему Авито?

1️⃣Авито самый посещаемый сайт объявлений в мире;
2️⃣Товары и услуги продающиеся на Авито это примерно 7% ВВП России;
3️⃣Несмотря на масштаб Авито продолжает расти темпами стартапа с сохраняющимся потенциалом для кратного роста;
4️⃣Авито – экологичный бизнес, давая вещам вторую жизнь удаётся сократить тонны отходов ежедневно.

Кто такой руководитель ML команды Авито?

Это тот, кто ставит хорошие цели и обеспечивает их выполнение. Цели должны быть понятными и приносить ценность, а команда, достигая их, не должна выгорать.

А значит:
Продумывает цели на квартал/год, следит за тем что они приносят ценность, амбициозны, достижимы, поддаются измерению и согласованы с другими командами;
❤️Занимается командой, то есть ведёт регулярные процессы, такие как стендап, планирование, ретро, демо, при необходимости вводит новые процессы и прекращает ненужные. Тимлид заботится о своих сотрудниках, проводит с каждым 1-1, вникает в их проблемы и стремится их решать, помогает развиваться;
✔️Отвечает за качества реализуемых решений, участвует в код ревью, ревью архитектуры, следит за покрытием метриками/тестами/алёртами;
💻Пишет код 20-30% рабочего времени и своим примером показывает, как это нужно делать.


Требования

Опыт управления командой ML инженеров от 1 года.

ML на уровне senior ds:
➡️ Хорошие знания классического ML и базовых задач DL для текстов и картинок;
➡️ Опыт реализации и эксплуатации ML решений от 4 лет;
➡️ Умение размечать данные для своих задач;
➡️ Владение стеком: pandas, sklearn, catboost, PyTorch;
➡️ Опыт работы с микросервисами на Python, Docker’ом, SQL и noSQL базами.

Условия

Кроме стандартного (ДМС, массажист, бюджеты на обучение, подробнее здесь):

⭐️ Paas. Cоздание нового сервиса или выкатка существуещего в прод одной строкой утилиты, например avito deploy my_service -e prod;
⭐️ Удобная работа с данными. Все события, чаты, клики, тексты, параметры, картинки связаны между собой и хранятся в одном месте;
⭐️ Своя, развитая платформа А/Б тестов. Для запуска теста нужно заполнить конфиг, все изменения метрик и оценка значимости будет проводиться автоматически;
⭐️ Прозрачный механизм карьерного роста. Регулярная обратная связь и оценка результатов (перфоманс ревью и калибровки раз в пол года, фиксированные матрицы ожиданий).

Контакты

Можно писать @glebbaianov или рекрутеру Кате @KateRazgon

Ответы на важные вопросы в первом комметарии к посту 👇

Проголосовать за канал

Читать полностью…

Нескучный Data Science Jobs

Компания: Альфа-банк 🅰️ , департамент продвинутой аналитики, Хаб РБ
Позиция: middle DS
Локация: частичная удалёнка (офис г. Москва, м. Технопарк) или полная удалёнка по договорённости
Вилка гросс: 200 - 250 тыс. руб. + ежеквартальный бонус ~15% (от дохода за квартал)
Задачи: разработка, поддержка и совершенствование моделей склонности, рекомендаций, uplift-а
Технологичеcкий стек: python, CatBoost/LightGBM, sklearn, pandas, numpy + SQL + git

Требования
:
- знание Spark, Hadoop, Hive + опыт работы с большими данными
- знание математической статистики
- знание основных принципов и алгоритмов классического ML, опыт перевода бизнес-задач в термины ML
- будет плюсом опыт работы с airflow/mlflow/dvc, участие в соревнованиях по машинному обучению, опыт работы в крупных ИТ-компаниях/банках/телеком/финтех на аналогичных позициях

Плюшки
:
- оплата участия в конференциях + оплата обучающих курсов
- работа в сильной команде (выпускников Физтех, ШАД, МГУ, ВШЭ)
- постоянное развитие: регулярный внутренний и внешний обмен знаниями, митапы, тренинги, конференции
- ДМС + стоматология, страхование жизни и выезжающих за рубеж
- бесплатный фитнес в офисе.
Контакты для резюме:
- tg:  @YOlgaVo
- email: oyvolodina@alfabank.ru
Контакты для вопросов:
- tg: @dmitry_tyr, @valeriy_vashchenko
 
Ответы на 10 важных вопросов:
1. Данные: Большие табличные данные в Hadoop.
2. Железо: k8s кластер с личным подом на 600Гб оперативы + ГПУ Nvidia A100
3. Масштаб влияния на core-бизнес: Финансовых эффект от внедрения моделей от 50 млн до 1 млрд руб в год
4. Уровень развития Data Science в компании: Выше среднего - бОльшая часть бизнеса использует модельный подход, есть команда МЛопс, ДЕ, Мониторинга и АБ тестов
5. Роль дата сайентиста: Будет отвечать за полный жизненный цикл модели
6. Бэкграунд у вашего потенциального руководителя: linkedin
7. Как часто вам будут мешать работать? Не более 2-3 часов в неделю на встречи с командой и руководителем.
8. Карьерный рост: По результатам работы, инициативность не остаётся незамеченной
9. Prod / Research: Преимущественно Prod
10. Функция сервиса или лидера: Сервис (не лидерская позиция)

Проголосовать за канал

Читать полностью…

Нескучный Data Science Jobs

Позиция: Эксперт в DS/ML/AI
Компания: Центр “Пуск” МФТИ, https://mipt.online/
Локация: удаленно
Формат работы: частичная занятость
Вилка: 116 000/мес net, до 516 000 net/семестр

О нас:
Центр “Пуск” МФТИ - подразделение университета, развивающее сетевые онлайн-программы дополнительного и высшего образования. Мы ищем эксперта, который пополнит команду наставников наших онлайн-магистратур и поможет магистрантам развивать ряд проектов, в основе которых - анализ данных и машинное обучение.

Чем предстоит заниматься:
- Проводить аудит работы в стартапах: анализировать нагрузку и функционал каждого члена команды, проверять адекватность личных планов каждого участника конечной бизнес-цели, корректировать планы команд для достижения их целей.
- Оценивать работу участников проектов на демо-днях и питчах. Давать развивающую обратную связь команде на мероприятии, готовить - рекомендации для каждого члена команды, оценивать личный вклад участников и командный прогресс в целом.
- Проводить еженедельные консультации по запросам студентов: разбирать общие проблемы, с которыми сталкиваются магистранты в стартапах, разбирать частные кейсы.
- Отвечать на вопросы студентов асинхронно, рекомендовать источники, направлять в поиске решений, делиться своим опытом, проверять их код/модели, разбирать ошибки, давать обратную связь.
- Проверять отчеты студентов по дипломным проектам, давать заключения по проделанной работе, оценивать вклад каждого студента.

Мы ожидаем, что вы:
- Имеете высшее образование в области компьютерных наук, информационных технологий или другой смежной.
- Имеете опыт менторинга отдельных специалистов и команд или опыт наставничества.
- Умеете давать обратную связь, полноценно аргументировать свои заключения, рекомендации и оценки.
- Дипломатичны и готовы конструктивно работать в связке с другими экспертами на некоторых форматах: академическим директором, индустриальными и научными руководителями студентов, их менторами, внешними экспертами из Клуба наставников.
- Доступны не менее 7 часов в неделю для консультаций по проектам.
- Готовы подписать NDA для работы с корпоративными стартапами (это стартапы, отвечающие на “боли” индустриальных партнеров программ - Сбера, Альфа-Банка, Авито, НЛМК и других компаний).

Будет плюсом:
- Академический бэкграунд, научные публикации в доменной области.
- Опыт работы с CV в medtech.

Мы предлагаем:
- Полностью удаленная работа, частичная занятость.
- Максимальное вознаграждение в семестр - 516 000 рублей net, в среднем около 116 тысяч на руки в месяц. Зависит от уровня вовлечения: занятость от 7 до 40 часов в неделю в зависимости от этапа подготовки к защитам проектов, в среднем - 18 часов в неделю.
- Персональное письмо МФТИ о вкладе в развитие программ (для виз талантов: O-1, Global Talent и других).
- Преимущество у самозанятых кандидатов или готовых оформить самозанятость (проконсультируем по оформлению).

Резюме и краткое сопроводительное ждем на почте: puskmipt@yandex.ru

Ответы на 10 важных вопросов в первом комментарии 👇

Читать полностью…

Нескучный Data Science Jobs

Позиция: Middle CV Machine Learning Engineer
Компания: Oxygen Technologies - oxytech.io
Локация: Удаленка из любой точки мира
Вилка: 250-300к руб/мес гросс

Кто мы?
Мы стартап в области AI решений для радиологии, т.е. для рентгенов, КТ и МРТ. Наши продукты уже используются в повседневной практике нескольких больниц, клиник и целых регионов.

Чем предстоит заниматься?
Созданием AI продуктов на основе нейросетей для диагностики различных заболеваний на рентгенах, КТ и МРТ снимках с 0 и до вывода в прод:
- поиск и анализ похожих решений
- анализ данных
- создание задач на разметку
- подготовка данных для разметки
- выбор архитектур нейронных сетей
- проведение экспериментов
- оценка качества работы моделей
- выкатка моделей в прод
- оптимизация моделей
- мониторинг и доработка моделей

Мы ожидаем:
- Опыт работы на должностях связанных с CV и DL 1.5 года+
- Опыт в задачах классификации, сегментации и детекции
- Качественный python: писать код с тайпингами и понимать для чего нужны тесты
- Хорошее знание PyTorch: умение тренировать модели и править архитектуры при необходимости
- MLOps: Git, Docker, а также знакомство с MLFlow/DVC/ClearML/etc.
- Умение работать в терминале и на серверах: bash, ssh, tmux, screen

Огромным плюсом будет:
- Опыт работы с 3D данными
- Опыт работы с медицинскими данными
- Опыт с форматом DICOM
- Опыт оптимизации и ускорения моделей для прода (прунинг, квантование, ONNX/TensorRT/OpenVINO)

Ответы на 10 важных вопросов:
1. Данные.
Более 1.5 млн исследований рентгенов, КТ и МРТ и с каждым днем их становится все больше. Своя команда врачей разметчиков.
2. Железо. Все обучение в облаке на V100ых.
3. Масштаб влияния на core-бизнес. Модели для радиологии - наш основная продукт.
4. Уровень развития Data Science в компании. Налажены все процессы работы с данными, разметкой, проведением экспериментов, созданием пайплайнов и выкаткой в прод.
5. Роль дата сайентиста. DS полностью отвечает за разработку конкретного продукта (например, обнаружение артроза на рентгене коленей), что включает в себя создание задач на разметку, разработку пайплайна, обучение моделей, контроль качества и дообучение.
6. Бэкграунд у вашего потенциального руководителя. LinkendIn CTO, LinkenIn CEO
7. Как часто вам будут мешать работать? Один созвон по пятницам, а остальные только по необходимости. Даже синков каждый день нет.
8. Карьерный рост. Ревью раз в год.
9. Prod / Research. Prod, но есть задачи, которые не решаются известными методами и тогда research.
10. Функция сервиса или лидера. Уклон в функцию сервиса, у нас есть долгосрочный роадмап продуктов, которых мы хотим сделать.

Контакты:
Форма для откликов: https://forms.gle/YJ98W1WYg5Sc1iVn8
Вопросы можно писать в личку @kinoooshnik

Читать полностью…

Нескучный Data Science Jobs

Позиция: Middle+
Куда? Альфа-банк, Департамент продвинутой аналитики, Хаб Риски, ЮЛ.
Формат работы: Гибрид: Москва, м. Технопарк + удаленно.
Вилка гросс: 180-280k + ежеквартальный бонус ~ 15% (от дохода за квартал).

Что нужно делать?
• Разрабатывать и поддерживать модели кредитного риска для поточного кредитования малого и среднего бизнеса (PD, LGD, EAD).
• Развивать и поддерживать внутренний фреймворк для разработки моделей.
• Генерировать и применять в моделях новые фичи на основе слабоструктурированных данных из Hadoop.
• Проводить эксперименты с нестандартными для классического скоринга подходами к моделированию.
• Анализировать эффективность новых источников данных и применять их в моделях.

Требования:
• Умение работать с данными (анализ, очистка, подготовка, отбор и создание признаков), навыки написания SQL-запросов.
• Хорошее знание теории вероятностей, математической статистики и методов машинного обучения.
• Опыт в разработке моделей машинного обучения от 1 года.
• Опыт работы c пакетами для анализа данных на Python3 (numpy, pandas, scikit-learn, xgboost, lightgbm, catboost, etc).
• Опыт работы с git.
• Желателен опыт работы с юридическими лицами, понимание, как устроена отчетность, какие модели и как можно применять для анализа компаний.

Ответы на 10 важных вопросов:
1. Данные: Hadoop + внешние источники по api. История 2017+. Данные доступны из среды разработки моделей.
2. Железо: Разработка моделей: kuber до 64 ядер + 512 ГБ оперативы. Продакшн: cистема исполнения моделей + команда MLOps. Для работы: МакБук + удалённое рабочее место.
3. Масштаб влияния на core-бизнес? Модели - ядро процесса поточного кредитования юрлиц, без них бизнес невозможен.
4. Уровень развития Data Science в компании? Все линии бизнеса покрыты ML моделями, где необходимо - успешно внедрен DL.
5. Роль дата сайентиста: ДС-ы участвуют в постановке задачи, совместно с командой рисков, прорабатывают генерацию фичей на условно подготовленных данных, обучают и документируют модель, подготавливают код для внедрения в прод, выполняют функцию аналитического сопровождения моделей после внедрения в прод.
6. Бэкграунд у вашего руководителя? linkedin
7. Как часто вам будут мешать работать? 2 часа организационных встреч в неделю.
8. Карьерный рост: круглый стол раз в квартал + формализованная матрица компетенций для каждой роли.
9. Prod/Research: Prod. От моделей требуется польза и эффективность.
10. Функция сервиса или лидера? На данном этапе сервисных функций больше.

📧 Akvolkov@alfabank.ru ✈️ @v0lkoff

Читать полностью…

Нескучный Data Science Jobs

Позиции: Middle/Senior Data Analyst/Product Analyst
Компания: Nutson, продукт https://cheelee.io/
Локация: Москва, возможна полная удаленка
Вилка: Middle [200-300к net], Senior [300-400к+ net]

О нас:
Cheelee (https://cheelee.io/) - это платформа коротких видео с механикой Watch2Earn, которая платит всем пользователям за просмотр ленты. Более 500 инфлюенсеров (50+ звезд интернета и ТВ) и внутренний продюсерский центр участвуют в постоянном создании эксклюзивного контента. Крутой момент зайти в проект, о котором узнает весь мир через пару лет, на начальном этапе = ) Нанимаем в команду R&D: нас 6 человек, каждый из которых немного глубже знает одну из областей (Data Analysts, ML Engineers и Software Engineers), но по факту мы все универсальные бойцы с должностью R&D Engineer. В данный момент ищем человека с более углубленным опытом продуктовой аналитики.

Чем предстоит заниматься:
- Метрики и ad hoc аналитика. Приложение активно развивается, быстро появляются новые фичи. Мы хотим постоянно замерять что происходит с приложением с разных точек зрения. Надо будет придумывать метрики, обсуждать их с product owner'ами, реализовывать в виде онлайн метрик с помощью SQL и python. Для реализации потребуется глубокое погружение в продукт и то как он работает.
- Построение дашбордов. Для отображения метрик мы используем Yandex Datalens. Чтобы метрики строились быстрее - нужно будет проектировать различные Aggregating Merge Trees. Писать SQL, делать визуализацию, презентовать бизнесу.
- Анализ данных и поиск аномалий. В приложении много разных игровых механик с использованием крипто-валюты. Надо будет смотреть на пользовательское поведение с разных сторон, искать аномалии и возможных мошенников. Взаимодействовать с финансовым отделом и делать экономическую аналитику.
- Участие в проведении АБ-тестов. Мы строим свою систему АБ-тестирования. Уже есть первая версия, использующая такие подходы как stratification, CUPED, linearization, bootstrap, delta method. Нужно расширять количество целевых метрик, участвовать в разработке системы АБ-тестирования, участвовать в планировании и анализе АБ-тестов.
- Построение ETL и DWH. Надо будет разобраться в том, что за данные, придумать, как их будем складывать в ClickHouse, учитывая то, как потом их надо будет использовать. Писать ETL пайплайны и схемы миграций для загрузки сообщений из Kafka в ClickHouse. На основе этих данных мы будем строить различные метрики.

Требования:
- python/SQL;
- Знание статистики и теории вероятностей;
- Опыт продуктовой аналитики, знание как считать продуктовые метрики (Retention, MAU, DAU, Sticky Factor, K-factor, ARPU, etc);
- Понимание классических алгоритмов и структур данных;
- Умение строить и проверять статистические гипотезы, проводить AB-тесты (boostrap, CUPED, stratification, MDE, etc);
- Практический опыт работы в ML.
Желательно
- Опыт работы с ClickHouse;
- Опыт работы с высоконагруженными системами;
- Опыт аналитики финансовых и экономических данных;
- Умение писать production код;

Ответы на 10 важных вопросов в первом комментарии 👇


Контакты для связи:
Резюме отправляйте в tg /channel/eviak

Читать полностью…

Нескучный Data Science Jobs

📣 Ищем к себе в Лабораторию

В прошлый раз получили множество резюме и уже взяли отличного стажера под задачу привлечения new-to-bank, однако под задачу разработки AutoML так и не смогли найти нашего идеального кандидата

Позиция: Стажер
Куда? Альфа-банк, Лаборатория машинного обучения, Команда монетизации нейронных сетей.
Формат работы: Удаленно в РФ или Москва, м. Технопарк. Возможна полная удаленка.
Вилка гросс: 50К, при успешной стажировке переход на Junior: 150-200K + ежеквартальный бонус ~ 15% (от дохода за квартал)

Наша команда занимается решением core-бизнес задач банка с применением DL и нешаблонного ML. На текущий момент в фокусе находится разработка моделей на неструктурированных источниках данных: транзакционные данные, данные бки, данные кассовых чеков, граф социального окружения клиента. Также в фокусе команды находится оптимизация рутинной деятельности банка по построению классических ML-моделей. Наша цель – усилить все модели банка за счёт новых подходов и источников данных, а также сократить time2market разрабатываемых моделей. Метрики качества наших моделей напрямую конвертируются в прибыль банка, поэтому у нас глубокая интеграция с бизнесом. Очень подробно про команду и задачи можно узнать из трека DL in Finance.

Что нужно делать?

Совместно с наставником—Kaggle-мастером стажеру предстоит полностью разработать и внедрить AutoML сервис по автоматическому построению бустинговых моделей. Задача включает в себя разработку всего пайплайна автоматического обучения бустингов, решение технических проблем интеграций и внедрения, а также улучшение качества и робастности ML в реальных условиях. Разработанный сервис покроет большое число задач и позволит бизнес-заказчику за пару кликов получать продовое решение, минуя рутинный процесс

Требования:
• Опыт работы с классическим ML и DL (учебные проекты/соревнования);
• технологический стек: python + pytorch, LightGBM/XGBoost/CatBoost, sklearn, pandas, numpy + sql + git.
• Понимание основных принципов и алгоритмов классического ML и DL
• Умение выбирать метрику под бизнес-задачу

Ответы на 10 важных вопросов:
На 9/10 важных вопросов есть ответы в оригинальной статье.

6. Руководитель: linkedin
Наставник: linkedin, kaggle (master)

Направляйте резюме на osidorshin@alfabank.ru с темой “Стажер в Лабораторию”

Читать полностью…

Нескучный Data Science Jobs

Вакансия: NLP Engineer, Middle/Senior
Компания: unleashing.ai
Где: Remote / Dubai
Вилка: $6-9k fulltime, есть парт-тайм, есть бонус за рекомендацию

Сейчас я помогаю строить и развивать команду ML-агентства unleashing.ai, спешащего выручить разные компании со всего света с интеграцией AI в проекты (то есть с ноги влетать в новые технологии). Мы активно растём, поэтому я ищу практически-ориентированных NLP-инженеров на разные задачи. Сейчас у нас работают люди с опытом в Amazon, Google, YC startups, из Колумбийского университета, Yandex, Replika.

Команда работает по разным направлениям, и значимой частью практически каждого проекта являются LLM’ки - и я считаю, что это отличный шанс быть на острие технологий, при этом не просто клепая демки по документации, а получая hands-on опыт.

Что придется делать:
- вместе со мной разрабатывать систем-дизайны для клиентов, а затем воплощать их в жизнь
- примерно 80% работы - инженерия (с бОльшим упором в ML, чем в SW), остаток - это митинги (в основном, со мной) для коммуникации и калибровки ожиданий, а также написание сопроводительной документации
- почти полный цикл разработки в ваших руках с большой свободой, без микроменеджмента

Что ожидается:
- трансформер ваш лучший друг 🤗
- крепкие знания по NLP, не только по отдельным архитектурам, но и по конкретным приложениям (больше - лучше): чатботы-болталки, Goal-Directed Dialog, retrieval, prompting, finetuning techniques, эвристики (читай :regex: ), и другое. В общем, не чтением статей едины.
- опыт выведения в прод (разные оптимизации моделей, процесс деплоя)
- ответственность, самостоятельность и автономность, умение держать контекст в голове, помнить что где кому и когда обещали.
- пунктуальность в дедлайнах, готовность к прозрачным коммуникациям. Если есть факап - его не нужно смахивать под ковёр
- разговорный английский как хороший плюс, письменный технический хотя бы на B1 - обязательно.

Если у вас есть достойный смежный опыт в других областях (аудио/CV наиболее релевантные), и теория в NLP - штош, попробовать тоже можно.
---
Дефолт вилка $6-8k за 40 часов, но мы пляшем от количества задач, нагрузки. Если вы хороший спец с интересным нам опытом (то есть в среднем куда быстрее будете закрывать майлстоуны, условно 40-часовой объем за 25 часов) - обязательно пишите, и по оплате возможны исключения. Оформление как вам удобно (включая Deel), через 2-3 месяца продуктивного сотрудничества готовы спонсировать визу в Дубай, где вы становитесь резидентом* и платите 0% налог 😳
ВАЖНО: предполагается, что вы готовы выходить на работу в ближайшее время, скажем, 1-2 недели. Если нет - в целом тоже окей, но тогда собесы будут проводиться позже, по необходимости.
---
Формат собеса: 2-3 собеседования по 30-60 минут, интро+опыт+технический собес по NLP + систем дизайн (не в строгом формате, лайтовее FAANG).

ответы на 10 важных вопросов в первом комментарии (не влезли в пост) 👇

Писать c вопросами в телегу @seeyouall
Направляйте ваши резюме на почту seeall@unleashing.ai с темой "NLP Engineer”

Читать полностью…

Нескучный Data Science Jobs

🔊 Ищем к себе в Лабораторию 5 NLP DS.
По 1 DS на каждое из направлений: чат-бот, voice-бот, классификация входящих обращений, речевая аналитика, генеративные модели.
Предпочтение отдадим наиболее сильным кандидатам.

Позиции: Junior/Middle/Senior Data Scientist.
Куда? Альфа-банк, Лаборатория машинного обучения, NLP-команда
Формат работы: Удаленно в РФ или Москва, м. Технопарк. Возможна полная удаленка с оформлением на территории РФ.
Вилка гросс: 120-200k/200-300k/300-400k + ежеквартальный бонус ~ 15% (от дохода за квартал).

Про команду:
Все NLP-задачи компании решаются силами этой команды. Сейчас в этой части команды 6 NLP DS.
Подробнее про результаты работы команды: про чат-бота, про работу с отзывами, про чеки, про классификацию обращений на 1000+ классов.

Что предстоит делать?
В Лабораториии задачи DSa не ограничиваются тюнингом параметров и выбором архитектур нейросетей. На этих позициях нужно будет плотно общаться с продуктовой командой и определять компоненты ml-продуктов, ставить задачи командам асессоров, дата инженеров, млопсов и мониторинга. Подробнее про роль дата сайентиста в нашей команде.

В направлениях чат-бота, voice-бота и классификации входящих обращений модели уже работают в проде.
Предстоит заниматься следующими задачами:
- Разрабатывать аналогичные модели для других сегментов клиентов. Например, модели voice-бота разработаны только для ФЛ, предстоит разработать для ЮЛ.
- Обновлять модели для ответов на вопросы клиентов про новые продукты и процессы
- Улучшать качество моделей за счет применения моделей на новых этапах принятия решения и новых данных.

В направлении речевой аналитики с нуля разрабатывать следующие модели:
- Оценка качества работы операторов и формирование рекомендации для обучения.
- Формирование рекомендаций в онлайне для повышения качества обслуживания.

В направлении генеративных моделей будем адаптировать LLM под задачи обслуживания клиентов.

Обязательные Требования:
• Опыт работы с нейронными сетями (учебные проекты/соревнования для Junior)/ опыт внедрения моделей в прод для Middle/Senior;
• Технологический стек: python + pytorch:, LightGBM/XGBoost/CatBoost, sklearn, pandas, numpy + sql + git.
• Практический подход к решению NLP-задач методами ML и DL.
• Понимание основных принципов и алгоритмов классического ML.
• Умение выбирать метрику под бизнес-задачу

Ответы на 10 важных вопросов.

Присылать резюме на esmirnov6@alfabank.ru с темой письма: "NLP DS в Лабораторию".

Читать полностью…

Нескучный Data Science Jobs

🔊 Ищем аналитика, который будет мониторить все наши NLP-модели

Позиция: Специалист аналитик мониторинга нейронных сетей
Куда? Альфа-Банк, Департамент продвинутой аналитики, Отдел аналитики качества моделирования
Формат работы: Гибрид - Москва, м. Технопарк + удаленно.
Вилка гросс: 250-300K + ежеквартальный бонус ~ 15% (от дохода за квартал).

Чем предстоит заниматься:

Организовывать и обеспечивать непрерывную работу мониторинга моделей Лаборатории Машинного Обучения, как правило это нейронные сети, NLP модели;
Реализовывать мониторинг моделей согласно требованиям бизнес-заказчиков и разработчиков;
Регулярно информировать заинтересованные стороны о состоянии моделей, разработав доступные подходы к презентации материалов: “бизнес-метрики для бизнеса, математика для математиков”
Разрабатывать и поддерживать методологию мониторинга, документацию, скрипты;
Принимать участие в А/Б-тестировании;
Участвовать в решение общекомандных задача команды мониторинга;
 
Наши пожелания к кандидатам:
Владение Python (statsmodels, seaborn, pyspark и т.п.) и SQL на высоком уровне в связке с Hadoop, Spark, Hive;
Опыт работы с инструментами визуализации PowerBI / SuperSet / Tableau
Хорошие знания в области математической статистики;
Умение доносить сложные математические идеи до бизнес-заказчиков;
Опыт постановки бизнес-требований, разработки и описания новых бизнес-процессов;
 
Не обязательно, но будет здорово, если есть:
Наличие опыта в А/Б-тестировании;
Знание основных методов машинного обучения (особенно NLP), опыт их применения к организации экспериментов на больших наборах данных;
Опыт работы с AirFlow;
Опыт разработки методологических положений и инструкций по проведению экспериментов;
 
Мы предлагаем:
Работу в сильной команде выпускников Физтеха, ШАДа, МГУ и ВШЭ — всегда есть, у кого поучиться
Работу как из дома, так и из офиса на Технопарке
Понятный и общеизвестный модельный и технологический стек
Регулярные митапы внутри и за пределами Альфа-банка
Корпоративное обучение
ДМС со стоматологией

Ответы на 10 важных вопросов:
1. Данные: Данных много. Обычно - Hadoop (все данные Альфа-Банка). Могут быть эзотерические источники – локальные БД (нужно будет перенести на Hadoop).
2. Железо: Потенциально – 2 TB RAM, 96 cores. Будем отталкиваться от необходимости и можем расширять аллокацию ресурсов.
3. Масштаб влияния на core-бизнес? Бизнес будет счастлив с пониманием, что все его продвинутые NLP-модели регулярно мониторятся и работают корректно.
4. Уровень развития Data Science в компании? Все линии бизнеса покрыты ML моделями, где необходимо - успешно внедрен DL.
5. Роль: см. что нужно делать (выше).
6. Бэкграунд у вашего руководителя? Ссылка
7. Как часто вам будут мешать работать? Минимум, 2 часа полезных организационных встреч в неделю. Сильно зависит от заказчиков и их пожеланий.
8. Карьерный рост: Лаборатория Машинного Обучения активно развивает покрытие своими моделями бизнеса, что увеличивает поток заказчиков и развитие функции.
9. Prod/Research: 70/30, разработка витрин и методологий тестирования с учетом лучших практик
10. Функция сервиса или лидера? Скорее сервис, здесь четко обозначен контур задач. Но это повод для амбиции разорвать шаблоны.

Присылать резюме на fgorokhov@alfabank.ru и ERazborova@alfabank.ru с темой письма: «Мониторинг NLP».

Читать полностью…

Нескучный Data Science Jobs

🔊 Ищу к себе в Лабораторию

Позиция: NLP Team Lead+
Куда? Альфа-банк, Лаборатория машинного обучения
Формат работы: Удаленно в РФ или Москва, м. Технопарк. Возможна полная удаленка.
Вилка гросс: 500-700k + ежеквартальный бонус ~ 15% (от дохода за квартал).

Задачи команды:
Команда улучшает сервис для клиентов, одновременно автоматизируя процесс обслуживания клиентов.
Основные ml-продукты команды:
Чат-боты для ФЛ и ЮЛ
⁃ Voice-боты для ФЛ и ЮЛ
⁃ Ассистенты оператора
⁃ Классификация и семантический анализ обратной связи клиентов
Классификация всех входящих обращений
Структуризация чеков ОФД
⁃ Голосовая аналитика оффлайн и онлайн [NEW]
⁃ другие некрупные задачи

Состав команды:
Сейчас в команде 6 DS = 4 Middle + 2 Jun. Параллельно будет производитmся набор еще 6 DS различного уровня. Каждый продукт курируется одним из DS, который выполняет полный жизненный цикл моделей (перевод задачи в ml-термины, постановка задач смежным командам: mlops, de, разметка, разработка, внедрение, обновление ). Роль NLP Team Lead+ подразумевает формирование ролей NLP Team Lead в подчинение.

Ключевые задачи на этой позиции:
⁃ Улучшение клиентского опыта и повышения автоматизации в обслуживании
⁃ Помощь команде в построении стратегии развития развитии ml-компонентов продукта
⁃ Построение аналитического self-сервиса для решение некрупных задач
⁃ Найм сильной команды и ее развитие
⁃ Построение эффективных процессов работы внутри команды и взаимодействия с внешними командами

Ожидание от кандидата:
⁃ Бывший Senior NLP с опытом реализации масштабных проектов
⁃ Успешный опыт построения крупных nlp-based продуктов
⁃ Отсутствие боязни к бюрократии в крупных компаниях и желание ее оптимизировать для своей команды
Подробнее о минимальных требованиях.

Ответы на 10 важных вопросов.

Присылать резюме на esmirnov6@alfabank.ru с темой письма: "NLP Team Lead в Лабораторию".

Читать полностью…

Нескучный Data Science Jobs

Позиция: Data Science Team Lead, модели рисков Юридических лиц.
Куда? Альфа-Банк, Департамент продвинутой аналитики, Хаб Риски
Формат работы: Гибрид - Москва, м. Технопарк + удаленно.
Вилка гросс: 400-600K + ежеквартальный бонус ~ 15% (от дохода за квартал).

Что нужно делать?

• Руководить направлением моделирования рисков малого и среднего бизнеса (команда из 7 DS). Нанимать и развать команду. Помогать команде в решение задач.
• Много общаться с бизнес-заказчиками и контрагентами, ответственными за различные этапы жизненного цикла моделей (риск-менеджеры, валидация, ml ops, BI, IT и тд).
• Планировать задачи и контролировать их выполнение.
• Репортить прогресс по задачам бизнес-заказчикам и CDS.
• Улучшать текущие процессы и фреймворки.

Задачи команды:
· Разрабатывать и поддерживать модели кредитного риска для поточного кредитования малого и среднего бизнеса (PD, LGD, EAD).
· Разрабатывать и поддерживать модели бизнес-процессов рисков малого и среднего бизнеса (прогнозирование выручки, прогнозирование прибыли, антифрод и тд)
· Развивать и поддерживать внутренний фреймворк для разработки моделей.
· Генерировать и применять в моделях новые фичи на основе слабоструктурированных данных из Hadoop.
· Анализировать эффективность новых источников данных и применять их в моделях.

Требования:
• Подтверждённый опыт решения задач машинного обучения.
• Хорошее знание теории вероятностей, математической статистики и методов машинного обучения.
• Лидерский опыт, опыт руководства командой.
• Опыт работы в git, confluence, jira.
• Развитые навыки коммуникации.
• Желателен опыт работы с юридическими лицами, понимание, как устроена отчетность, какие модели и как можно применять для анализа компаний.

Ответы на 10 важных вопросов:
1. Данные: Hadoop + внешние источники по api. История 2017+. Данные доступны из среды разработки моделей.
2. Железо: Разработка моделей: kuber до 64 ядер + 512 ГБ оперативы. Продакшн: cистема исполнения моделей + команда MLOps. Для работы: МакБук + удалённое рабочее место.
3. Масштаб влияния на core-бизнес? Модели - ядро процесса поточного кредитования юрлиц, без них бизнес невозможен.
4. Уровень развития Data Science в компании? Все линии бизнеса покрыты ML моделями, где необходимо - успешно внедрен DL.
5. Роль дата сайентиста: ДС-ы участвуют в постановке задачи, совместно с командой рисков, прорабатывают генерацию фичей на условно подготовленных данных, обучают и документируют модель, подготавливают код для внедрения в прод, выполняют функцию аналитического сопровождения моделей после внедрения в прод.
6. Бэкграунд у вашего руководителя? linkedin
7. Как часто вам будут мешать работать? Мешать работать не будут вообще) но примерно половина рабочего времени - общение с контрагентами, другая половина - общение с командой.
8. Карьерный рост: круглый стол раз в квартал + формализованная матрица компетенций для каждой роли.
9. Prod/Research: Prod. От моделей требуется польза и эффективность.
10. Функция сервиса или лидера? роль лидера команды DS

Присылайте резюме ✈️ @alan_bzrv

Читать полностью…

Нескучный Data Science Jobs

Всем привет!
🚀 Появилась отличная вакансия, на которой можно построить АБ-тестирования с нуля!
Работа в этой команде заслуживает личной рекомендации!


Позиция: A/B-tests Team Lead (сейчас команда – 0 человек).
Куда? Альфа-Банк, Департамент продвинутой аналитики, отдел Аналитики Качества Моделирования.
Формат работы: Гибрид - Москва, м. Технопарк + удаленно.
Вилка гросс: 350-450K + ежеквартальный бонус ~ 15% (от дохода за квартал).

Что нужно делать?
1. Общаться (много!) с владельцами процессов, определять методологию проведения тестов, запускать тесты самостоятельно (или контролировать процесс запуска), анализировать данные и формировать аналитические отчёты, описывать всё это в Confuence, помогать бизнес-заказчикам принимать правильные решения.
2. Создавать с нуля и описывать обобщённую методологию проведения сплит-тестов, которую смогут переиспользовать другие; выстраивать формализованные процессы; распространять и пропагандировать лучшие практики по механикам проведения экспериментов (как в Альфе, так и вовне).
3. Растить функцию на основе череды успехов – с фактами в руках защищать планы роста, быть руководителем и лидером для будущей команды.
4. Принимать участие в создании архитектурных решений для платформ проведения сплит-тестов, в идеале - создания единого контура тестирования моделей машинного обучения.
5. Первоочередные задачи – поддержка экспериментов команды Центра компетенций по NLP Лаборатории машинного обучения.

Требования:
1. Идеальный кандидат будет иметь опыт руководства функцией сплит-тестирования. Общий опыт работы в этом направлении – от 2 лет.
2. Лидерский опыт (начинать придётся одному), опыт руководства командой (будут успехи – будет команда), проактивность и умение самостоятельно достигать результат.
3. Hard skills: Python, bash, SQL, Hadoop; Tableau/ClickView/PowerBI; BitBucket (Git), JIRA и Confluence.
4. Образование: физ.-мат., техническое, ИТ; хорошая база в мат.стате и теор.вере; чёрный пояс по пакетам для стат. анализа и визуализации в Python (statsmodels, seaborn и т.п.). У нас нет и не будет R 😈
5. Развитые коммуникативные навыки для ведения переговоров с внутренними и внешними контрагентами, некоторые из которых могут быть (ошибочно) уверены, что и так всё понятно, и так всё хорошо работает. Умение писать понятную и грамотную документацию, аналитические записки. Грамотная устная и письменная речь, структурированное изложение мыслей. Время от времени придётся делать презентации на понятном для конкретного заказчика языке - это тоже надо уметь.
6. Идеально, если есть ещё и опыт создания, сопровождения и развития единого фреймворка сплит-тестирования в организации.

Ответы на 10 важных вопросов:
1. Данные: Обычно - Hadoop (все данные Альфа-Банка) + внешние источники по API. Могут быть эзотерические источники – локальные БД (Vertica, MongoDB и т.п.).
2. Железо: Потенциально – 2 TB RAM, 96 cores. Будем отталкиваться от необходимости и можем расширять аллокацию ресурсов. Для работы: MacBook + удалённое рабочее место.
3. Масштаб влияния на core-бизнес? Модели - ядро большинства банковских процессов. Амбиция – ответственность за все тестирование моделей (или процессов, с ними связанных) в Альфа-Банке.
4. Уровень развития Data Science в компании? Все линии бизнеса покрыты ML моделями, где необходимо - успешно внедрен DL.
5. Роль: см. что нужно делать (выше).
6. Бэкграунд у вашего руководителя? LinkedIn
7. Как часто вам будут мешать работать? Пока непонятно. Минимум, 1 час организационных встреч в неделю. Остальное будет зависеть от конкретных заказчиков и операционного ритма с ними.
8. Карьерный рост: формализованная матрица компетенций не создана – придётся разрабатывать.
9. Prod/Research: на начальном этапе Prod – 80% (надо проводить тестирование в боевых процессах), Research – 20% (инвестиция в развитие методологии). В целевом сценарии, после создания и роста команды, пропорция обратная.
10. Функция сервиса или лидера? 50/50. Функция создаётся с 0. Задача – обеспечивать качественный аналитический сервис.

Присылать резюме на fgorokhov@alfabank.ru с темой письма: "A/B-tests Team Lead".

Читать полностью…

Нескучный Data Science Jobs

Позиции 3шт: MLE / DS / DE / MLOps от Junior+ до Senior
Компания: стартап ИТМО.ИСКИН Консалтинг
Локация: Санкт-Петербург, возможна полная удаленка
Вилка: Junior+ [120k-180k], Middle [180k-260k], Senior [260k-350k] net

О нас:
Мы занимаемся полным циклом разработки интеллектуального ПО, обеспечивающих трансфер AI разработок в коммерческие продукты. Также разрабатываем свои продукты на основе AI.

Чем предстоит заниматься:
- Проводить технологии через полный цикл AI разработки, продукционализировать решения и выкатывать в бизнес юниты
- Исследовать, разрабатывать, оптимизировать AI технологии в разных доменах
- Работать с big* data разной природы
- Проводить тестирование и валидировать модели

Требования:
- Продуктовый опыт в 2+ областях ML, приоритет (CV, Time Series, NLP, RL, GAN, Speech)
- Уверенные знания алгоритмов и структур данных, прикладной статистики и мат. анализа.
- Умение писать промышленный код (Python, C++ / Scala)
- Знание технологий для ведения разработки (Git, Docker, Linux)
- Умение вести эксперименты.

Будет плюсом:
- Опыт разработки микросервисных архитектур
- Опыт работы с MLFlow, Airflow, S3, Hadoop, DVC
- Знания распределенных вычислений Spark
- Опыт с CI (Jenkins, kubernetes)
- Продуктовый опыт в разработке полного цикла ML решения
- Хотеть чего-то большего

Мы предлагаем:
- Оформление по ТК РФ; Конкурентная заработная плата по итогам собеседования (полностью «белый» - доход, для ребят за границей также есть решения вопроса);
- Премии и бонусы по итогам релизов;
- Интересные и сложные продукты;
- Заряженная команда;
- Большой вклад в мир и ценности через AI продукты

Ответы на 10 важных вопросов в первом комментарии
1. Данные: стек Hadoop, Spark, S3, DVC Качество, количество и т.д. данных зависит от разрабатываемого продукта. Есть Data Engineering функция в команде, отвечающая за ETL.
2. Железо: есть собственная инфра на A6000, также для масштабирования арендуем облака в зависимости от продукта. На 2 сотрудников инстанс с 2xA6000
3. Масштаб влияния на core-бизнес? Мы разрабатываем капсульные решения для интеграции их в бизнес.
4. Уровень развития Data Science в компании? Мы стартап и строго регламентируем ML флоу разработки внутри.
5. Роль дата сайентиста: полный цикл от понимания бизнес потребности до внедрения решений для решения ее.
6. Бэкграунд у вашего руководителя? LinkedIn
7. Как часто вам будут мешать работать? Мы придерживаемся четкого Agile флоу ведения проектов с больший уклоном в сторону kanban и с глобальными итерациями по scram. У нас ты не работаешь, а создаешь продукт, поэтому weekly обязательно))
8. Карьерный рост: рост по результатам performance review, которые проходят по завершению проектов.
9. Prod/Research: В зависимости от спринта) Prod 60% + Research (как внедряемые технологии) 40%
10. Функция сервиса или лидера? Лидера 50% + Сервиса 50%

Контакты для связи:
Резюме отправляйте в tg @SkylarPro - Tech Lead

Читать полностью…

Нескучный Data Science Jobs

🔊 Ищем к себе в Лабораторию

Позиция: Стажер
Компания: Альфа-Банк, Лаборатория машинного обучения, монетизация нейронных сетей.
Локация: Москва, м. Технопарк. Возможна полная удаленка.
Вилка: 50К гросс, при успешной стажировке переход на Junior: 150-200K + ежеквартальный бонус ~15% (от дохода за квартал).

Про команду:
Наша команда занимается решением core-бизнес задач банка с применением DL и нешаблонного ML. На текущий момент в фокусе находятся разработка моделей на неструктурированных источниках данных (транзакционные данные, данные БКИ, данные кассовых чеков, граф социального окружения клиента), а также построение AutoML-сервисов. Наша цель – усилить все модели банка за счёт новых подходов и источников данных, а также сократить time2market разрабатываемых моделей. Метрики качества наших моделей напрямую конвертируются в прибыль банка, поэтому у нас глубокая интеграция с бизнесом.
Очень подробно про команду и задачи можно узнать из трека на DL in Finance.
Подробнее про роль дата сайентиста в нашей команде.

Ожидаем:
· опыт работы с классическим ML и DL (учебные проекты/соревнования);
· технологический стек: python + pytorch, LightGBM/XGBoost/CatBoost, sklearn, pandas, numpy, sql, git;
· понимание основных принципов и алгоритмов классического ML и DL;
· умение выбирать метрику под бизнес-задачу.

Будет плюсом:
· опыт решения NLP задач / задач на последовательных данных методами из DL;
· топовые места в соревнованиях по машинному обучению.

Помимо ежемесячной оплаты труда вас ждет:
· отсутствие бесполезных встреч;
· работа в сильной команде (выпускников Физтех, ШАД, МГУ, ВШЭ);
· постоянное развитие: регулярный внутренний и внешний обмен знаниями, митапы, тренинги, конференции.

Ответы на 10 важных вопросов.

Направляйте резюме на VSmirnov3@alfabank.ru с темой “Стажер в Лабораторию”.

Читать полностью…

Нескучный Data Science Jobs

Позиция: Business Analyst
Компания: invygo
Вилка: $4087-$6267 (AED 15k-23k) + опционы + мед. страховка
Локация: Дубай 🐪
Формат работы: Гибрид (4 дня в офисе, 1 день из дома)

About invygo:
Founded in 2018 and headquartered in Dubai, invygo aims at simplifying the process of getting a car. With the success of our expansion to Saudi Arabia in 2021, we have continued to grow our operations. Being the first car subscription app of its kind in the region, we have a proven track record and an in-depth understanding of our customers' mobility needs. Our app enables customers to own or subscribe to a car on a monthly basis without any hassle. Customers can commit for a minimum of 1 month with our monthly plans or 36 months with our Subscribe to Own service. invygo's car subscription service is different from renting or buying a car. We offer the best of both worlds. Unlike renting, we don't require our customers to make a large deposit upfront. At invygo, we empower our customers to access a car with no deposit or down payment, no long-term commitment, and the option to cancel their monthly subscription plans at any time through our seamless digital platform.

Responsibilities:
• Conduct thorough data analysis and interpretation to extract valuable insights and drive informed business decisions.
• Collaborate with cross-functional teams, including stakeholders, business leaders, and data engineers, to understand business requirements and translate them into data analysis solutions.
• Design and develop data models, dashboards, and reports to visualize and communicate complex data findings effectively.
• Identify and define key performance indicators (KPIs) and metrics to measure business performance and track progress towards organizational goals.
• Gather, clean, and validate data from various sources, ensuring data quality and integrity.
• Perform statistical analysis, predictive modeling, and data mining techniques to identify patterns, trends, and opportunities.
• Provide actionable recommendations based on data insights to drive process improvements, optimize operations, and enhance overall business performance.
• Collaborate with IT teams to ensure data availability, accuracy, and security, while adhering to relevant data governance policies and regulations.
• Stay updated with the latest industry trends, tools, and techniques in data analysis, and apply them to enhance analytical capabilities and drive innovation.
• Communicate findings, insights, and recommendations to both technical and non-technical stakeholders through presentations, reports, and visualizations.

Requirements:
• Proven experience as a Business Analyst, Data Analyst, or similar role, with a strong focus on data analysis and visualization.
• Proficient in data analysis tools such as SQL, Python, R, or similar programming languages.
• Experience with data visualization tools such as Tableau, Power BI, or QlikView.
• Strong analytical and problem-solving skills with the ability to analyze complex data sets and draw meaningful conclusions.
• Familiarity with statistical analysis, predictive modeling, and data mining techniques.
• Excellent communication and presentation skills, with the ability to effectively convey complex concepts to both technical and non-technical stakeholders.
• Ability to work independently and collaboratively in a fast-paced environment.
• Comfortable working in a scaling startup

От нанимающего:
Коллектив душевный, разношерстный. Много русскоговорящих ребят. Недавно наняли тимлида из Теслы 🚙 руководить разрабами.
Офис у метро (с видом на Burj Al Arab), круассаны-фрукты-чай, по вечерам понедельников компания заказывает еду на весь офис 🍔.
С онбордингом помогу.
Компания помогает с релокацией (оплата авиабилета и отеля на первое время).
Если есть пара лет опыта, хороший SQL и английский - смело подавайтесь 💪

CV + LinkedIn в личку @this_is_spartaa

Ответы на 10 важных вопросов в первом комментарии 👇

Читать полностью…

Нескучный Data Science Jobs

🔊 Ищем к себе в Лабораторию

Позиция: Стажер
Компания: Альфа-банк, Лаборатория машинного обучения, монетизация неройнных сетей
Локация: Москва, м. Технопарк. Возможна полная удаленка.
Вилка: 50К гросс, при успешной стажировке переход на Junior: 150-200K + ежеквартальный бонус ~ 15% (от дохода за квартал)


Про команду:
Наша команда занимается решением core-бизнес задач банка с применением DL и нешаблонного ML. На текущий момент в фокусе находится разработка моделей на неструктурированных источниках данных: транзакционные данные, данные бки, данные кассовых чеков, граф социального окружения клиента. Наша цель – усилить все модели банка за счёт новых подходов и источников данных, а также сократить time2market разрабатываемых моделей. Метрики качества наших моделей напрямую конвертируются в прибыль банка, поэтому у нас глубокая интеграция с бизнесом.
Очень подробно про команду и задачи можно узнать из трека на DL in Finance .
Подробнее про роль дата сайентиста в нашей команде.

Ожидаем:
· опыт работы с классическим ML и DL (учебные проекты/соревнования);
· технологический стек: python + pytorch, LightGBM/XGBoost/CatBoost, sklearn, pandas, numpy, sql, git;
· понимание основных принципов и алгоритмов классического ML и DL;
· умение выбирать метрику под бизнес-задачу;

Будет плюсом:
· опыт решения NLP задач / задач на последовательных данных методами из DL;
· топовые места в соревнованиях по машинному обучению;
Помимо ежемесячной оплаты труда вас ждет:
· отсутствие бесполезных встреч;
· работа в сильной команде (выпускников Физтех, ШАД, МГУ, ВШЭ);
· постоянное развитие: регулярный внутренний и внешний обмен знаний, митапы, тренинги, конференции;

Ответы на 10 важных вопросов.

Направляйте резюме на asenin@alfabank.ru с темой “Стажер в Лабораторию”.

Читать полностью…

Нескучный Data Science Jobs

🔊 Позиции мониторинга и аб-тестирования для нейронных сетей мы успешно закрыли, теперь требуется усилить команду валидации в этом и других направлениях: нейронные сети (чат-боты, голосовые боты, прогнозные модели), казначейский модели (процентный риск, трансфертное ценообразование, ликвидность), общекорпоративные функции (геолокация, работа сети отделений, банкоматов).

Позиции: Junior/Middle Data Scientist x6
Куда: Альфа-Банк, Управление валидации, команда валидации моделей нефинансовых рисков.
Формат работы: смешанный (офис+дом) в г. Москва м. Технопарк, по регионам РФ возможен полностью удаленный формат.
Вилка: 150-200/200-280к гросс + ежеквартальный бонус (~15% от дохода за квартал).
 
Что предстоит делать?
Проводить валидацию (независимо тестировать качество) моделей. Включает: анализ данных разработки, проверка на независимых данных, подготовку выводов о найденных недостатках/ предложениях по улучшению качества модели. При необходимости – разрабатывать альтернативную модель. Также нужно придумывать/предлагать новые методы тестирования для различных типов моделей, по которым методики еще не было разработано. Нужно плотно общаться как с разработчиками, так и с заказчиками моделей, чтобы оценить адекватность решения поставленной заказчиком задачи по разработке.
По итогу выполнения работы готовится отчет с выводами и рекомендациями.
 
Обязательные требования:
·         Опыт работы с нейронными сетями
·         Технологический стек: python, LightGBM/XGBoost/CatBoost, pandas, numpy+sql+git.
·         Понимание основных принципов и алгоритмов классического ML
·         Хорошее знание теории вероятности, математической статистики.
 
Ответы на 10 важных вопросов:
1. Данные: Hadoop + внешние источники по api. Данные 2012+.
2. Железо: сервер 80 ядер, 1.5ТБ оперативки.
3. Масштаб влияния на core бизнес: модели являются ключевыми элементами работы множества процессов банка. Вы влияете на то, насколько эффективными будут эти процессы.
4. Уровень развития Data Science в компании: высокий. Ключевые процессы используют модели в течение длительного времени.
5. Роль валидатора: ключевые модели без заключения валидатора не могут быть использованы в процессах.
6. Бэкграунд потенциального руководителя: linkedin
7. Как часто вам будут мешать работать: 2 часа организационных встреч в неделю.
8. Карьерный рост: оценка по компетенциям 1 раз в год.
9. Prod/Research: Prod. Требуется эффективность и качество предлагаемых решений.
10. Функция сервиса или лидера: Сервисных функций больше на данном этапе.

Ваше резюме направляйте на почту Vperevitskaya@alfabank.ru

Читать полностью…

Нескучный Data Science Jobs

Позиция: Middle+/Senior CV engineer
Компания: Третье Мнение, https://thirdopinion.ai
Локация: Москва, офис недалеко от м. Улица 1905 года
Формат работы: гибрид
Вилка: Middle 240-280к net, Senior 280-380к net
 
О нас:
Третье Мнение
- разработчик IT-решений для системы здравоохранения. Мы создаем продукты на основе технологии искусственного интеллекта, позволяющие автоматизировать процессы в медицинском учреждении, ускорить процесс принятия врачебного решения и обеспечить безопасность пациентов и медицинского персонала. Чем предстоит заниматься:
- Разработкой алгоритмов глубокого обучения для работы с медицинскими изображениями
- Поиском, обучением и внедрением SOTA решений для задач классификации, сегментации и детекции
- Исследованием методов работы с шумной разметкой
- Оптимизацией и ускорением нейросетей
- Глубоким погружением в предметную область
 
Мы ожидаем, что ты:
- Имеешь опыт работы в Deep Learning: Middle - 1-3 года, Senior - 3-6 лет
- Знаком с базовой математической подготовкой и знание классических библиотек: numpy, scikit-learn, pandas, cv2
- Имеешь опыт работы с одним из фреймворков глубокого обучения Pytorch / TensorFlow и хорошие навыки программирования на Python
- Обладаешь знаниями классических моделей классификации, сегментации и детекции (EfficientNet, Unet, YOLO, etc.), практические навыки применения
- Имеешь базовое понимание docker, git и linux
- Умеешь разбираться и имплементировать SOTA подходы
- Будешь сопровождать процесс разработки на всех этапах - от постановки экспериментов до интеграции решения
 
Будет плюсом:
- Навыки работы с медицинскими данными
- Опыт работы в одном из направлений: Domain Adaptation, Active Learning, Metric Learning, Unsupervised Learning
- Применение на практике TensorRT и ONNX
- Написание научных статей
 
Мы предлагаем:
- Современный уютный офис в центре Москвы (недалеко от м. Улица 1905 года) с гибким началом рабочего дня и удобным графиком
- Прямую связь с командой, руководителем и менеджментом компании в концепции полного доверия и максимальной прозрачности
- Программу ДМС в лучших клиниках страны, включая стоматологию
- Корпоративное обучение и развитие за счет компании
- Мощное железо, необходимое для работы, на выбор
 
Ответы на 10 важных вопросов:
1. Данные.
Несколько терабайт. У нас свой штат сотрудников, каждый день занимающихся разметкой. Есть дата-инженеры, отвечающие за структуру и хранение данных.
2. Железо. 8xA40, 8xV100, 24xA5000 + аренда облака
3. Масштаб влияния на core-бизнес. Каждый разрабатываемый продукт напрямую влияет на заработок компании. Работы в стол нет.
4. Уровень развития Data Science в компании. ML-сервисы в компании - core продукт. У нас выстроены процессы работы с данными, с проведением экспериментов и продуктивизацией решений. За каждый этап отвечает соответствующая команда.
5. Роль дата сайентиста. Постановка задач на разметку данных - DS принимает решение о том, какой объем данных и какой тип разметки ему нужен. Изучение sota-подходов в медицине. Имплементация кода из статей. Обучение моделей. Продумывание и имплементация бизнес-логики поверх аутпутов моделей. Интеграция в пайплайны.
6. Бэкграунд у вашего потенциального руководителя linkedin (head of AI) linkedin (руководитель направления)
7. Как часто вам будут мешать работать?
Не больше 2 часов в неделю на орг встречи.
8. Карьерный рост. Ревью 2 раза в год.
9. Prod / Research. 80% - построение рабочих моделей, 20% - интеграция в общий пайплайн.
10. Функция сервиса или лидера. Больше сервисных функций.
 
Присылать резюме на cv@3opinion.ai с темой “CV-инженер, нескучный data science”
Также можно писать в тг: @grisha_p

Читать полностью…

Нескучный Data Science Jobs

Позиция: Стажер дата-аналитик
Компания: Х5 Group
Формат: Продолжительность стажировки 3/6 месяцев (full-time/part-time)
Локация: Удаленная работа (но по желанию можно работать из офиса, г. Москва)
Вилки: Оклад 60 тыс.руб. gross для full-time/ 30 тыс.руб. для part-time
Мы ищем аналитика-стажера, которому интересно готовить к запуску эксперименты в оффлайн-магазинах и онлайн-ритейле, оценивать эффективность многомиллионных экспериментов и решать нестандартные продуктовые задачи по улучшению работы более чем 20 000 магазинов по всей стране и повышения клиентского опыта 15 млн клиентов.
Что нужно делать:
• дизайнить эксперименты на магазинах и клиентах
• оценивать экономические эффекты от инициатив по чековым данным
• решать разнообразные ad-hoc-задачи и помогать бизнесу
• заниматься продуктовой аналитикой

Мы ждём, что вы:
• владеете Python
• знаете SQL
• увлечены Статистикой и ML

Мы предлагаем:
• менторскую поддержку на всем этапе стажировки
• классный коллектив, теплую атмосферу и веселые ретро с играми и битвой мемов

Ответы на 10 важных вопросов:
1. Данные: данных петабайты, стек Hadoop, Hive, Spark.
2. Железо: под команду 2 сервера под расчеты, каждый Intel Xeon 32Core 256 GB RAM Bare Metal.
Данные храним в Hadoop.
Что касаемо ноутбуков - выдаются Macbook Pro или Dell.
3. Масштаб влияния на core-бизнес? Решаемые задачи затрагивают 20000 магазинов по всей стране.
4. Уровень развития Data Science в компании? Data Science в компании выделен как одно из ключевых направлений.
5. Роль дата сайентиста: полный цикл от понимания бизнес потребности до внедрения решений для решения ее.
6. Бэкграунд у вашего руководителя? https://www.linkedin.com/in/amsakhnov/
7. Как часто вам будут мешать работать? мешать работать не будем, 3-4 часа регулярных встреч в неделю
8. Карьерный рост: рост по результатам performance review, которые проводятся 2 раза в год.
9. Prod/Research: задача может быть любая, так что research + prod
10. Функция сервиса или лидера? На этапе стажировки 100% сервис.

Свои CV и вопросы направлять: tg @didi_ulyanova

Читать полностью…

Нескучный Data Science Jobs

🔊 Ищем к себе в Лабораторию 4 NLP DS.
Под направления: чат-бот, voice-бот, классификация входящих обращений, речевая аналитика, генеративные модели.
Предпочтение отдадим наиболее сильным кандидатам.

Позиции: Junior/Middle/Senior Data Scientist.
Куда? Альфа-банк, Лаборатория машинного обучения, NLP-команда
Формат работы: Удаленно в РФ или Москва, м. Технопарк. Возможна полная удаленка с оформлением на территории РФ.
Вилка гросс: 120-200k/200-300k/300-450k + ежеквартальный бонус ~ 15% (от дохода за квартал).

Про команду:
Все NLP-задачи компании решаются силами этой команды. Сейчас в этой части команды 6 NLP DS.
Подробнее про результаты работы команды в треке nlp in practice.

Что предстоит делать?
В Лаборатории задачи DSa не ограничиваются тюнингом параметров и выбором архитектур нейросетей. На этих позициях нужно будет плотно общаться с продуктовой командой и определять компоненты ml-продуктов, ставить задачи командам асессоров, дата инженеров, млопсов и мониторинга. Подробнее про роль дата сайентиста в нашей команде.

В направлениях чат-бота, voice-бота и классификации входящих обращений модели уже работают в проде.
Предстоит заниматься следующими задачами:
- Разрабатывать аналогичные модели для других сегментов клиентов. Например, модели voice-бота разработаны только для ФЛ, предстоит разработать для ЮЛ.
- Обновлять модели для ответов на вопросы клиентов про новые продукты и процессы
- Улучшать качество моделей за счет применения моделей на новых этапах принятия решения и новых данных.

В направлении речевой аналитики с нуля разрабатывать следующие модели:
- Оценка качества работы операторов и формирование рекомендации для обучения.
- Формирование рекомендаций в онлайне для повышения качества обслуживания.

В направлении генеративных моделей будем адаптировать LLM под задачи обслуживания клиентов.

Обязательные Требования:
• Опыт работы с нейронными сетями (учебные проекты/соревнования для Junior)/ опыт внедрения моделей в прод для Middle/Senior;
• Технологический стек: python + pytorch:, LightGBM/XGBoost/CatBoost, sklearn, pandas, numpy + sql + git.
• Практический подход к решению NLP-задач методами ML и DL.
• Понимание основных принципов и алгоритмов классического ML.
• Умение выбирать метрику под бизнес-задачу

Ответы на 10 важных вопросов.

Присылать резюме на esmirnov6@alfabank.ru с темой письма: "NLP DS в Лабораторию".

Читать полностью…

Нескучный Data Science Jobs

Позиции 5шт: MLE, DS, DE, MLOps от Junior+ до Senior
Компания: стартап ИТМО.ИСКИН (консалтинг)
Локация: Санкт-Петербург, возможна полная удаленка
Вилка: Junior+ [120k-180k], Middle [180k-260k], Senior [260k-310k] net

О нас:
Мы занимаемся полным циклом разработки интеллектуального ПО, обеспечивающих трансфер ML-я разработок в коммерческие проекты. Также разрабатываем свои продукты на основе ML.

Чем предстоит заниматься:
- Проводить решение через полный цикл ML разработки, выкатывать / упаковывать решение в бизнес юниты.
- Исследовать, разрабатывать, оптимизировать модели в разных доменах ML, работать с данными разной природы.
- Проводить эксперименты и валидировать модели.

Требования:
- Продуктовый опыт в 2+ областях ML, приоритет (CV, Time Series, NLP, RL, GAN)
- Продуктовый опыт в разработке полного цикла ML решения.
- Уверенные знания алгоритмов и структур данных, прикладной статистики и мат. анализа.
- Умение писать промышленный код (Python, C++ / Scala)
- Знание технологий для ведения разработки (Git, Docker,Linux)
- Умение вести эксперименты.

Будет плюсом:
- Опыт разработки микросервисных архитектур
- Опыт работы с MLFlow, Airflow, S3, Hadoop
- Знания распределенных вычислений Spark
- Опыт с CI ( Jenkins, kubernetes)

Мы предлагаем:
- Оформление по ТК РФ; Конкурентная заработная плата по итогам собеседования (полностью «белый» - доход, для ребят за границей также есть решения вопроса);
- Премии и бонусы по итогам работы;
- Интересные и сложные задачи;
- Заряженная команда

Ответы на 10 важных вопросов в первом комментарии
1. Данные: стек Hadoop, Spark, S3. Качество, количество и т.д. данных зависит от разрабатываемого продукта. Есть Data Engineering функция в команде, отвечающая за ETL.
2. Железо: есть собственная инфра на A6000, также для масштабирования арендуем облака в зависимости от продукта. На 2 сотрудников инстанс с 2xA6000
3. Масштаб влияния на core-бизнес? Мы разрабатываем капсульные решения для интеграции их в бизнес.
4. Уровень развития Data Science в компании? Мы стартап и строго регламентируем ML флоу разработки внутри.
5. Роль дата сайентиста: полный цикл от понимания бизнес потребности до внедрения решений для решения ее.
6. Бэкграунд у вашего руководителя? LinkedIn
7. Как часто вам будут мешать работать? Мы придерживаемся четкого Agile флоу ведения проектов с больший уклоном в сторону kanban и с глобальными итерациями по scram. У нас ты не работаешь, а создаешь продукт, поэтому weekly обязательно))
8. Карьерный рост: рост по результатам performance review, которые проходят по завершению проектов.
9. Prod/Research: В зависимости от спринта) Prod 60% + Research (как внедряемые технологии) 40%
10. Функция сервиса или лидера? Лидера 50% + Сервиса 50%

Контакты для связи:
Резюме отправляйте в tg @SkylarPro - Tech Lead

Читать полностью…

Нескучный Data Science Jobs

🔊 Ищем к себе в Лабораторию 2 стажеров

Позиция: 2 x Стажер
Куда? Альфа-банк, Лаборатория машинного обучения, Команда монетизации нейронных сетей.
Формат работы: Удаленно в РФ или Москва, м. Технопарк. Возможна полная удаленка.
Вилка гросс: 50К, при успешной стажировке переход на Junior: 150-200K + ежеквартальный бонус ~ 15% (от дохода за квартал)

Наша команда занимается решением core-бизнес задач банка с применением DL и нешаблонного ML. На текущий момент в фокусе находится разработка моделей на неструктурированных источниках данных: транзакционные данные, данные бки, данные кассовых чеков, граф социального окружения клиента. Также в фокусе команды находится оптимизация рутинной деятельности банка по построению классических ML-моделей. Наша цель – усилить все модели банка за счёт новых подходов и источников данных, а также сократить time2market разрабатываемых моделей. Метрики качества наших моделей напрямую конвертируются в прибыль банка, поэтому у нас глубокая интеграция с бизнесом. Очень подробно про команду и задачи можно узнать из трека DL in Finance.

Что нужно делать?
Ищем на 2 задачи:

1. Совместно с наставником стажеру предстоит полностью разработать и внедрить AutoML сервис по автоматическому построению бустинговых моделей. В процессе разработки необходимо решать технические проблемы интеграций и улучшать робастность ML к условиям реального мира. Разработанный сервис покроет большое число задач и позволит бизнес-заказчику за пару кликов получать продовое решение, минуя рутинный процесс

2. Стажеру предстоит разрабатывать и внедрять ML модели для улучшения привлечения новых клиентов. Модели охватывают широкий спектр задач: предсказание склонности и одобрения, прогнозирование LTV, предсказание оттока/форда и другие. В рамках стажировки предстоит не только писать код, но и плотно взаимодействовать с заказчиками, проводить A/B тестирование моделей, погружаться в бизнес-процессы банка.

Требования:
• Опыт работы с классическим ML и DL (учебные проекты/соревнования);
• технологический стек: python + pytorch, LightGBM/XGBoost/CatBoost, sklearn, pandas, numpy + sql + git.
• Понимание основных принципов и алгоритмов классического ML и DL
• Умение выбирать метрику под бизнес-задачу

Ответы на 10 важных вопросов:
На 9/10 важных вопросов есть ответы в оригинальной статье.

6. Руководитель: linkedin
Наставник по 1 задаче: linkedin
Наставник по 2 задаче: linkedin

По первой задаче направлять резюме на osidorshin@alfabank.ru с темой “Стажер в Лабораторию” / @fullyconnected
По второй задаче направлять резюме на gsmirnov2@alfabank.ru с темой “Стажер в Лабораторию” / @PetrofanI

Читать полностью…

Нескучный Data Science Jobs

Позиция: Senior Data Scientist
Куда? Quantum Light
Формат работы: Fully remote (from non-sanctioned countries)
Вилка: £70k - £110k / year base salary ($90k - $135k) + 20% bonus + profit sharing (carry) depending on your level

Что нужно делать?
⁃ Строить ML модели для инвестирования в стартапы на growth стадиях
⁃ Погружаться в Venture Capital домен
⁃ Строить гипотезы и инжинирить фичи
⁃ Работать с качеством данных (пропуски, коррелированные фичи, много источников)

Требования:
⁃ Analytical and problem-solving mindset
⁃ Strong Python and coding skills
⁃ History of designing ML or Data systems for production
⁃ 3+ years of experience in Data Science / ML
⁃ Domain knowledge in finance, investing or venture capital is a plus

Ответы на 10 важных вопросов:
1. Данные: Spark, S3, много источников данных, богатая история. Есть Data Engineering функция в команде, отвечающая за data pipelines. Объём данных: 40 ТБ, сотни тысяч - миллионы entities.
2. Железо: AWS инфра, десятки машин и сотни CPU, возможность скейлинга вширь. Для работы: macbook.
3. Масштаб влияния на core-бизнес? Quantum Light — алгоритмический VC фонд. Модели, которые мы строим, выбирают цели для инвестирования.
4. Уровень развития Data Science в компании? Все технические роли в фонде связаны с Data Science.
5. Роль дата сайентиста: full cycle от генерации гипотезы и оценки источника данных до разработки моделей, бектестов и запуска в продакшен
6. Бэкграунд у вашего руководителя? standy.me, LinkedIn
7. Как часто вам будут мешать работать? мешать работать не будем, 3-4 часа регулярных встреч в неделю
8. Карьерный рост: за год команда фонда выросла от 2 до 20 человек, рост по результатам performance review, которые проходят раз в квартал
9. Prod/Research: research + prod
10. Функция сервиса или лидера? Лидера

Присылайте ваши резюме: 📧 elizabeth@quantumlightcapital.com или ✈️ @elizaether

Читать полностью…

Нескучный Data Science Jobs

Позиция: A/B-tests Team Lead (сейчас команда – 0 человек).
Куда? Альфа-Банк, Департамент продвинутой аналитики, Дирекция моделей и методов продвинутой аналитики.
Формат работы: Гибрид - Москва, м. Технопарк + удаленно.
Вилка гросс: 300-400K + ежеквартальный бонус ~ 15% (от дохода за квартал).

Что нужно делать?
1. Общаться (много!) с владельцами процессов, определять методологию проведения тестов, запускать тесты самостоятельно (или контролировать процесс запуска), анализировать данные и формировать аналитические отчёты, описывать всё это в Confuence, помогать бизнес-заказчикам принимать правильные решения.
2. Создавать с нуля и описывать обобщённую методологию проведения сплит-тестов, которую смогут переиспользовать другие; выстраивать формализованные процессы; распространять и пропагандировать лучшие практики по механикам проведения экспериментов (как в Альфе, так и вовне).
3. Растить функцию на основе череды успехов – с фактами в руках защищать планы роста, быть руководителем и лидером для будущей команды.
4. Принимать участие в создании архитектурных решений для платформ проведения сплит-тестов, в идеале - создания единого контура тестирования моделей машинного обучения.
5. Первоочередные задачи – поддержка экспериментов команды Центра компетенций по NLP Лаборатории машинного обучения.

Требования:
1. Идеальный кандидат будет иметь опыт руководства функцией сплит-тестирования. Общий опыт работы в этом направлении – от 2 лет.
2. Лидерский опыт (начинать придётся одному), опыт руководства командой (будут успехи – будет команда), проактивность и умение самостоятельно достигать результат.
3. Hard skills: Python, bash, SQL, Hadoop; Tableau/ClickView/PowerBI; BitBucket (Git), JIRA и Confluence.
4. Образование: физ.-мат., техническое, ИТ; хорошая база в мат.стате и теор.вере; чёрный пояс по пакетам для стат. анализа и визуализации в Python (statsmodels, seaborn и т.п.). У нас нет и не будет R 😈
5. Развитые коммуникативные навыки для ведения переговоров с внутренними и внешними контрагентами, некоторые из которых могут быть (ошибочно) уверены, что и так всё понятно, и так всё хорошо работает. Умение писать понятную и грамотную документацию, аналитические записки. Грамотная устная и письменная речь, структурированное изложение мыслей. Время от времени придётся делать презентации на понятном для конкретного заказчика языке - это тоже надо уметь.
6. Идеально, если есть ещё и опыт создания, сопровождения и развития единого фреймворка сплит-тестирования в организации.

Ответы на 10 важных вопросов:
1. Данные: Обычно - Hadoop (все данные Альфа-Банка) + внешние источники по API. Могут быть эзотерические источники – локальные БД (Vertica, MongoDB и т.п.).
2. Железо: Потенциально – 2 TB RAM, 96 cores. Будем отталкиваться от необходимости и можем расширять аллокацию ресурсов. Для работы: MacBook + удалённое рабочее место.
3. Масштаб влияния на core-бизнес? Модели - ядро большинства банковских процессов. Амбиция – ответственность за все тестирование моделей (или процессов, с ними связанных) в Альфа-Банке.
4. Уровень развития Data Science в компании? Все линии бизнеса покрыты ML моделями, где необходимо - успешно внедрен DL.
5. Роль: см. что нужно делать (выше).
6. Бэкграунд у вашего руководителя? LinkedIn
7. Как часто вам будут мешать работать? Пока непонятно. Минимум, 1 час организационных встреч в неделю. Остальное будет зависеть от конкретных заказчиков и операционного ритма с ними.
8. Карьерный рост: формализованная матрица компетенций не создана – придётся разрабатывать.
9. Prod/Research: на начальном этапе Prod – 80% (надо проводить тестирование в боевых процессах), Research – 20% (инвестиция в развитие методологии). В целевом сценарии, после создания и роста команды, пропорция обратная.
10. Функция сервиса или лидера? 50/50. Функция создаётся с 0. Задача – обеспечивать качественный аналитический сервис.

Присылать резюме на vayuyev@alfabank.ru с темой письма: "A/B-tests Team Lead".

Читать полностью…

Нескучный Data Science Jobs

Позиция: Разработчик-исследователь в Computer Vision
Куда: Яндекс Маркет
Формат работы: Офис, Москва, м. Аминьевская
Вилка гросс: 250 000 —‍ 450 000 ₽/мес

Что нужно делать?
-автоматизировать инвентаризацию: определять состояние паллеты по изображению, улучшать его на основе последовательности снимков;
-определять положение коробки относительно камеры на роботе: выявлять тип коробки и её 3D-положение по одному изображению;
-разрабатывать детекторы, чтобы обеспечивать складскую безопасность;
-доводить модель до продакшен-состояния, тестировать подход в бизнесовом пайплайне конкретного робота.

Требования:
-понимаете ML-методы и решали с их помощью бизнес-задачи;
-создавали нейросети для работы с изображениями, применяя PyTorch, TensorFlow или другой фреймворк;
-знаете классические алгоритмы и структуры данных;
-умеете и любите решать сложные проблемы, аргументированно отстаиваете свою точку зрения;
-решаете задачи с помощью Python.

Ответы на 10 важных вопросов:
1.Данные: Изображения и датасеты с ежедневного наката роботов на складе + доразметка данных через Толоку, для новых сложных проектов - консультации при составлении проекта.
2.Железо: Для обучения моделей (GPU/CPU), хранения данных - YTsaurus . Для разработки - выделенная виртуалка с 2x TeslaV100. Таргетовое железо на роботе - Jetson AGX Xavier 32GB. Для работы - Macbook.
3.Масштаб влияния на core-бизнес? Разработка продукта для нового направления, развитие CV в Market Robotics для анализа существующих складских процессов и их оптимизации, уменьшение CPI.
4.Уровень развития Data Science в компании? Data Science в компании выделен как одно из ключевых направлений. Для удобной работы и разработки компания создала огромную инфраструтуру и множество удобных инструментов. Рекомендательные модели используются практически во всех сервисах.
5.Роль дата сайентиста: построение моделей/подходов для разработки приложений, покрывающих бизнейс кейсы складской робототехники, выставление требований на разметку данных в Толоку, выстраивание требований к продукту (камеры/освещение)
6.Бэкграунд у вашего руководителя? linkedin
7.Как часто вам будут мешать работать? 2-3 часа организационных встреч в неделю (ежедневные митапы с командой, общие встречки-демо отдела)
8.Карьерный рост: ревью 2 раза в год
9.Prod/Research: исследование (70%) с базовым построением продуктового пайплайна (30%) для проверки работоспособности моделей. Катить модели в прод и их оптимизировать под железо будут ваши коллеги
10.Функция сервиса или лидера? 70/30 в сторону функции сервиса. Есть базовые потребности и текущие проекты, однако мы всегда поощраем инициативность в проектах и новые предложения (учитывая, что наше направление новое и мы живём в формате стартапа внутри большой компании)
✈️ @Tanya_ITRec

Читать полностью…
Subscribe to a channel