Middle NLP Data Scientist

Шукаємо в Україні
Віддалено
Повна зайнятість

Prom.ua – найбільший маркетплейс України, де продаються понад 100 млн товарів від десятків тисяч підприємців з усієї країни.

Гіміранова Анна

Middle NLP Data Scientist

Prom.uaнайбільший маркетплейс України, де продаються понад 100 млн товарів від десятків тисяч підприємців з усієї країни.

На Prom.ua:

  • кожен покупець може знайти все, що потрібно, за найкращою ціною: від зубної щітки до культиватора для саду та городу.
  • кожен підприємець може продавати товари в каталозі маркетплейса, на сайті, створеному на платформі Prom та у мобільному додатку “Prom покупки”.

 

Prom.ua в цифрах:

  • щодня маркетплейс відвідують 4,8 млн осіб
  • на маркетплейсі працюють понад 60 тис. компаній
  • у каталозі 120 млн товарів

Про команду Data Science:

Ми оптимізуємо різні частини продукту, використовуючи дані і алгоритми машинного навчання. Паралельно розбудовуємо ШІ системи, що надають стратегічну перевагу бізнесу і рухають компанію в напрямку електронної комерції майбутнього.

Зараз в команді 5 людей: 4 Data Scientist і Team Lead.

Напрямки роботи команди:

  • Рекомендації товарів і персоналізація;
  • Пошук та ML-ранжування;
  • Машинний переклад контенту товарів;
  • Автоматична модерація товарів у каталозі, класифікація товарів;
  • Визначення дублів товарів;
  • Генерація і валідація тегів для SEO

Особливості роботи в команді:

  • велика залученість в продуктове середовище, тісна міжкомандна взаємодія – > мало досліджень йде під стіл, багато моделей в production
  • розуміння поставлених цілей, орієнтованість на результат -> модельки роблять те, що потрібно, і не роблять те, що не потрібно 
  • відсутність бюрократії, можливість приймати участь у виборі задач, розвинена культура ініціативності і відповідальності за результат
  • фокус на розбудові інфраструктури для більшої надійності рішень, автоматизації рутини і створення нових можливостей в задачах
  • колаборація і командний дух: взаємна небайдужість і підтримка, дружня атмосфера
  • обмін досвідом: авторські курси, презентації проєктів, командні грумінги і т.д.

 

Розбудовуємо тісні зв’язки з командою розробки та тестування. Бізнесову оцінку рішень нам допомагають робити аналітики. 

Для повсякденної роботи піднятий JupyterHub сервер з можливістю задавати необхідні характеристики робочого середовища, можна працювати на локальній машині, якщо є необхідність. Маємо свої сервери з відеокартами для навчання і розгортання моделей.

Проєкти з технічного боку:

Мова програмування: Python

Аналіз і обробка даних: Jupyter Notebook, Pandas, NumPy

Machine Learning і Deep Learning: Scikit-learn, TensorFlow, PyTorch, FAISS, XGBoost

Візуалізація даних і моніторинг: Matplotlib, Seaborn, Plotly, Bokeh, Tableau, Grafana

Бази даних: Postgres

Big Data і розподілені обчислення: Apache Spark, Hadoop

MLOps: MLflow, DVC, TensorFlow Serving, Python packaging, Fast API

Даги: Airflow, 

Черги даних: Kafka, 

Пошук: Elasticsearch.

Для даної ролі важливо:

  • глибоке розуміння роботи нейронних мереж, особливо NLP: розуміння відмінностей архітектур моделей, принципів застосування, тюнингу гіперпараметрів, переніс навчання, навчання з нуля
  • досвід класифікації/сегментації/генерації текстів як класичними методами, так і deep learning
  • досвід роботи з фреймворками для розробки нейромереж (PyTorch/TensorFlow)
  • досвідченість у роботі з машинним навчанням: постановка задачі, збір і дослідження даних, тренування моделі, оцінка результатів, аналіз роботи моделі, підготовка до розгортання;
  • досвід розгортання та супроводження моделі в production, покращення вже існуючих моделей
  • вміння писати надійний і чистий код на python, розуміння і використання різних структур даних, OOP, а також, володіння VC (Git etc);
  • готовність глибоко занурюватись в бізнес-задачі і переводити їх в ml-терміни (архітектура, функції втрат, метрики)

Що буде плюсом:

  • досвід навчання моделей на даних, що перевищують обсяг пам’яті, досвід з високонавантаженими системами, Big Data і розподіленими обчисленнями
  • досвід у застосуванні практик MLOps: контроль версій коду, даних і моделей, автоматичного розгортання, моніторингу і логування, тестування моделей, перенавчання моделей
  • досвід роботи з ембедингами і ANN

Задачі:

  • генерація більш конверсійного контенту для товарів
  • покращення системи пошуку дублів товарів
  • покращення моделі класифікації товарів і машинного перекладу
  • дослідження нових напрямків застосування машинного навчання для вирішення задач бізнесу

Ми пропонуємо:

  • Офіційне працевлаштування у штат компанії
  • 24 календарних дні оплачуваної відпустки на рік, необмежена кількість лікарняних.
  • Віддалена робота. Можливість відвідувати офіс в м.Київ
  • Медичне страхування
  • Послуги корпоративного психолога

Етапи відбору:

Відбір по резюме

Інтервʼю-знайомство

Технічне інтерв’ю

Фінальне інтерв’ю

Поділитись вакансією у соціальних мережах

Життя в EVO

Незламний офіс

Сучасний простір, де безліч місць для роботи, зустрічей, дозвілля та спорту. Є автономне живлення, безперебійний зв’язок, тепло та облаштоване бомбосховище.

Дивитись

Волонтерство

Розвиваємо проєкти, які наближують Перемогу. Проводимо благодійні заходи. Донатимо. Підтримуємо волонтерські ініціативи співробітників.

Дивитись

Спортивні спільноти

Підтримуємо футбольні, бігові та велокоманди співробітників. Є спортивний майданчик та тренажерна зала.

Дивитись