Поиск работы на сайте Jobvk.com
Разместить вакансию
Разместить резюме

Старший Data Scientist, Факторы ранжирования

Ozon
  • Полная занятость

Привет! Это команда Факторов ранжирования.

Мы отвечаем за весь процесс разработки и внедрения факторов, которые используются в ML-моделях ранжирования в поиске и каталоге Ozon: от анализа данных до хранения и расчёта факторов в runtime. У нас — петабайты логов пользовательских событий и возможности быстро проверять гипотезы, которые напрямую влияют на продукт с аудиторией в десятки миллионов человек. Мы делаем прогрессивные вещи и применяем cutting edge технологии.

Направление поиска возглавляет Игорь Куралёнок — в прошлом руководитель оценки качества поиска в Яндексе, глава R&D лаборатории Huawei и автор десятков научных работ по ML, поиску и распределённым вычислениям.

Сейчас мы ищем старшего Data Scientist в новообразованную подгруппу, которая отвечает за разработку, приёмку и запуск факторов ранжирования в прод.

Наш стэк: Python, PySpark, ClickHouse, Airflow, MLflow, PyTorch, CatBoost, Java.

Вы будете:

  • Заниматься полным циклом разработки факторов для моделей ранжирования: исследовать исходные данные, автоматизировать расчёт агрегатов и факторов на PySpark, формализовать и проводить приёмку новых факторов.
  • Разрабатывать сложные факторы ранжирования для поиска и каталога: текстовые на основе foundation-моделей, персонализированные признаки, факторы, основанные на рекомендациях, и другие.
  • Подбирать подходящие ML-решения под задачи бизнеса, планировать и запускать оффлайн- и онлайн-эксперименты, оценивать влияние факторов на качество ранжирования.

Примеры задач:

  • Построение процедуры приёмки для офлайн-оценки полезности факторов.
  • Разработка факторов под конкретные товарные категории (например, одежда или продукты с express-доставкой).
  • Формирование факторов под разные бизнес-цели: снижение сроков доставки, повышение конкурентоспособности по цене в поисковой выдаче и т.п.
  • Оптимизация хранения и расчёта факторов: выделение агрегаций в Hadoop и вычисление итоговых признаков в runtime.
  • Улучшение текущего DSSM-фактора с использованием foundation-модели карточки товара для повышения релевантности выдачи.

Нам важно:

  • Опыт работы в Data Science от 3 лет.
  • Уверенные знания машинного обучения и понимание математических основ ML.
  • Хорошее знание Python и опыт написания поддерживаемого кода.
  • Знание Hadoop-стэка и опыт работы с большими объёмами данных.

Будет плюсом:

  • Опыт работы с рекомендательными системами или в NLP-задачах.
  • Понимание архитектуры высоконагруженных систем.
  • Опыт разработки на Java.

Работа в Ozon — это

  • Люди, которым не всё равно — ценим инициативу и самостоятельность, доверяем друг другу и даём свободу в принятии решений;
  • Открытая культура — мы учимся на ошибках и фокусируемся на решении проблем, а не на поиске виноватых;
  • Сильная команда, которой мы гордимся — обсуждаем идеи, обмениваемся экспертизой, просим совета и поддерживаем друг друга;
  • Современный стэк и развитая инженерная культура — реализуем амбициозные проекты и создаём решения, которых ещё нет на рынке.