• Розробка продукту
  • Data science та аналітика

Middle Data Scientist

Поділитися

Про проєкт:

Prom.uaнайбільший маркетплейс України, де продаються понад 100 млн товарів від десятків тисяч підприємців з усієї країни.

На Prom.ua:

  • кожен покупець може знайти все, що потрібно, за найкращою ціною: від зубної щітки до культиватора для саду та городу.
  • кожен підприємець може продавати товари в каталозі маркетплейса, на сайті, створеному на платформі Prom та у мобільному додатку “Prom покупки”.

Prom.ua в цифрах:

  • щодня маркетплейс відвідують 4,8 млн осіб
  • на маркетплейсі працюють понад 60 тис. компаній
  • у каталозі 120 млн товарів 

Про команду Data Science:

Ми оптимізуємо різні частини продукту, використовуючи дані і алгоритми машинного навчання. Паралельно розбудовуємо свої ШІ системи, що надають стратегічну перевагу і рухають компанію в напрямку електронної комерції майбутнього.

 

Зараз в команді 5 людей: 4 Data Scientist і Team Lead. 

 

Напрямки роботи команди:

  • Рекомендації товарів і персоналізація;
  • Пошук та ML-ранжування;
  • Машинний переклад контенту товарів;
  • Автоматична модерація товарів у каталозі;
  • Визначення дублів товарів;
  • Візуальний пошук.

 

Особливості роботи в команді

 

  • велика залученість в продуктове середовище, тісна міжкомандна взаємодія – > мало даремних досліджень, багато моделей в production
  • розуміння поставлених цілей, орієнтованість на результат -> модельки роблять те, що потрібно, і не роблять те, що не потрібно 
  • відсутність бюрократії, можливість приймати участь у виборі задач, розвинена культура ініціативності і відповідальності за результат
  • фокус на розбудові інфраструктури для більшої надійності рішень, автоматизації рутини і створення нових можливостей в задачах
  • колаборація і командний дух: взаємна небайдужість і підтримка, дружня атмосфера
  • обмін досвідом: авторські курси, презентації проєктів, командні грумінги тощо.

 

Розбудовуємо тісні зв’язки з командою розробки. Бізнесову оцінку рішень нам допомагають робити аналітики. 

Для повсякденної роботи піднятий JupyterHub сервер з можливістю задавати необхідні характеристики робочого середовища, можна працювати на локальній машині, якщо є необхідність. Маємо свої сервери з відеокартами для навчання і розгортання моделей.

 

Технічний стек:

Мова програмування: Python

Аналіз і обробка даних: Jupyter Notebook, Pandas, NumPy

Machine Learning і Deep Learning: Scikit-learn, TensorFlow, PyTorch, FAISS, XGBoost

Візуалізація даних і моніторинг: Matplotlib, Seaborn, Plotly, Bokeh, Tableau, Grafana

Бази даних: Postgres

Big Data і розподілені обчислення: Apache Spark, Hadoop

MLOps: MLflow, DVC, TensorFlow Serving, Python packaging, Fast API

Даги: Airflow,

Черги даних: Kafka,

Пошук: Elasticsearch.

 

Що важливо для даної ролі:

  • вміння самостійно справлятися з труднощами і знаходити потрібну інформацію, системне мислення
  • досвідченість у роботі з машинним навчанням: постановка задачі, збір і дослідження даних, тренування моделі, оцінка результатів, аналіз роботи моделі, підготовка до розгортання;
  • вміння писати надійний і чистий код на python, розуміння і використання різних структур даних, OOP, а також, володіння VC (Git etc);
  • знання сучасних архітектур нейронних мереж, досвід з Computer Vision і/або NLP
  • досвід роботи з базами даних, SQL-запити

Буде перевагою:

  • досвід у застосуванні практик MLOps: контроль версій коду, даних і моделей, автоматичного розгортання, моніторингу і логування, тестування моделей, перенавчання моделей
  • досвід роботи з векторним пошуком
  • досвід з високонавантаженими системами, Big Data і розподіленими обчисленнями

Ймовірні задачі:

  • покращення системи пошуку дублів товарів
  • побудова моделі визначення контрафактних товарів
  • покращення моделі векторизації товарів
  • розвиток MLOps рішень, зокрема feature store для задач рекомендацій і пошуку
  • створення пайплайнів машинного навчання для різних задач
  • прототипування моделей в нерозвіданих зонах продукту

Режим роботи:

  • працюємо в зручний час, важливо бути на зв’язку з 11:00 до 18:00 і бути присутнім на зустрічах;
  • немає щоденних стендапів, можна працювати спокійно;
  • базовий режим роботи віддалений, але практикуємо щотижневі відвідування офісу, щодватижні збираємось на командні обіди

Етапи відбору:

  • Знайомство (тривалість 30 хв)
  • Технічне інтерв’ю (тривалість 1,5 години). Обговоримо всі важливі питання по стеку, досвіду, завданням.
  • Фінальна співбесіда 

Ми пропонуємо:

  • Офіційне працевлаштування у штат компанії
  • 24 календарних дні оплачуваної відпустки на рік, необмежена кількість лікарняних.
  • Медичне страхування
  • Послуги корпоративного психолога

Анастасія з People Team

Анастасія

Хочу до вас у команду

Прикріпити резюме

Максимум 1 файл розміром до 5 МБ