
- Розробка продукту
- Data science та аналітика
Middle Data Scientist
Про проєкт:
Prom.ua – найбільший маркетплейс України, де продаються понад 100 млн товарів від десятків тисяч підприємців з усієї країни.
На Prom.ua:
- кожен покупець може знайти все, що потрібно, за найкращою ціною: від зубної щітки до культиватора для саду та городу.
- кожен підприємець може продавати товари в каталозі маркетплейса, на сайті, створеному на платформі Prom та у мобільному додатку “Prom покупки”.
Prom.ua в цифрах:
- щодня маркетплейс відвідують 4,8 млн осіб
- на маркетплейсі працюють понад 60 тис. компаній
- у каталозі 120 млн товарів
Про команду Data Science:
Ми оптимізуємо різні частини продукту, використовуючи дані і алгоритми машинного навчання. Паралельно розбудовуємо свої ШІ системи, що надають стратегічну перевагу і рухають компанію в напрямку електронної комерції майбутнього.
Зараз в команді 5 людей: 4 Data Scientist і Team Lead.
Напрямки роботи команди:
- Рекомендації товарів і персоналізація;
- Пошук та ML-ранжування;
- Машинний переклад контенту товарів;
- Автоматична модерація товарів у каталозі;
- Визначення дублів товарів;
- Візуальний пошук.
Особливості роботи в команді
- велика залученість в продуктове середовище, тісна міжкомандна взаємодія – > мало даремних досліджень, багато моделей в production
- розуміння поставлених цілей, орієнтованість на результат -> модельки роблять те, що потрібно, і не роблять те, що не потрібно
- відсутність бюрократії, можливість приймати участь у виборі задач, розвинена культура ініціативності і відповідальності за результат
- фокус на розбудові інфраструктури для більшої надійності рішень, автоматизації рутини і створення нових можливостей в задачах
- колаборація і командний дух: взаємна небайдужість і підтримка, дружня атмосфера
- обмін досвідом: авторські курси, презентації проєктів, командні грумінги тощо.
Розбудовуємо тісні зв’язки з командою розробки. Бізнесову оцінку рішень нам допомагають робити аналітики.
Для повсякденної роботи піднятий JupyterHub сервер з можливістю задавати необхідні характеристики робочого середовища, можна працювати на локальній машині, якщо є необхідність. Маємо свої сервери з відеокартами для навчання і розгортання моделей.
Технічний стек:
Мова програмування: Python
Аналіз і обробка даних: Jupyter Notebook, Pandas, NumPy
Machine Learning і Deep Learning: Scikit-learn, TensorFlow, PyTorch, FAISS, XGBoost
Візуалізація даних і моніторинг: Matplotlib, Seaborn, Plotly, Bokeh, Tableau, Grafana
Бази даних: Postgres
Big Data і розподілені обчислення: Apache Spark, Hadoop
MLOps: MLflow, DVC, TensorFlow Serving, Python packaging, Fast API
Даги: Airflow,
Черги даних: Kafka,
Пошук: Elasticsearch.
Що важливо для даної ролі:
- вміння самостійно справлятися з труднощами і знаходити потрібну інформацію, системне мислення
- досвідченість у роботі з машинним навчанням: постановка задачі, збір і дослідження даних, тренування моделі, оцінка результатів, аналіз роботи моделі, підготовка до розгортання;
- вміння писати надійний і чистий код на python, розуміння і використання різних структур даних, OOP, а також, володіння VC (Git etc);
- знання сучасних архітектур нейронних мереж, досвід з Computer Vision і/або NLP
- досвід роботи з базами даних, SQL-запити
Буде перевагою:
- досвід у застосуванні практик MLOps: контроль версій коду, даних і моделей, автоматичного розгортання, моніторингу і логування, тестування моделей, перенавчання моделей
- досвід роботи з векторним пошуком
- досвід з високонавантаженими системами, Big Data і розподіленими обчисленнями
Ймовірні задачі:
- покращення системи пошуку дублів товарів
- побудова моделі визначення контрафактних товарів
- покращення моделі векторизації товарів
- розвиток MLOps рішень, зокрема feature store для задач рекомендацій і пошуку
- створення пайплайнів машинного навчання для різних задач
- прототипування моделей в нерозвіданих зонах продукту
Режим роботи:
- працюємо в зручний час, важливо бути на зв’язку з 11:00 до 18:00 і бути присутнім на зустрічах;
- немає щоденних стендапів, можна працювати спокійно;
- базовий режим роботи віддалений, але практикуємо щотижневі відвідування офісу, щодватижні збираємось на командні обіди
Етапи відбору:
- Знайомство (тривалість 30 хв)
- Технічне інтерв’ю (тривалість 1,5 години). Обговоримо всі важливі питання по стеку, досвіду, завданням.
- Фінальна співбесіда
Ми пропонуємо:
- Офіційне працевлаштування у штат компанії
- 24 календарних дні оплачуваної відпустки на рік, необмежена кількість лікарняних.
- Медичне страхування
- Послуги корпоративного психолога
Схожі вакансії
- Middle Data Analyst EVO Fintech
- Python Engineer (Вчасно Каса) Вчасно
- Python Engineer (Вчасно КЕП ) Вчасно