Hydrosphere.io

О проекте

Hydrosphere — внутренний стартап Provectus, претерпевший несколько изменений идеи с момента возникновения. Изначально был связан с Big Data, сейчас — это продукт для мониторинга ML моделей в продакшене.

Суть следующая: после деплоя модели машинного обучения в продакшн, модель делает предсказания, приносит бизнесу прибыль и инсайты. Цель Hydrosphere — анализировать качество модели без получения дополнительных размеченных данных. Текущая версия продукта способна вовремя сообщить пользователю о деградация модели и снижению качества ее предсказаний.

Обычно, чтобы измерить качество модели машинного обучения, необходимо иметь размеченные данные, чтобы было с чем сравнивать предсказания, — верные они или нет. В продакшене бывает сложно вовремя получить новые размеченные данные, чтобы своевременно оценить качество. Для решения этой проблемы Hydrosphere использует качество данных как прокси для оценки качества модели. Мы можем так делать, потому знаем, что модель начинает делать неверные предсказания, когда данные перестают быть похожими на те, на которых она тренировалась. Hydrosphere фиксирует момент, когда данные изменяются и предупреждает об этом пользователя, чтобы тот смог своевременно отреагировать на события, изменившие данные.

Наш продукт предназначен для ML Engineer, ответственных за работу ML моделей, а также технических менеджеров, стремящихся к качественному ML в продакшене.

Среди наших партнеров — Nvidia, поддерживающая стартапы в сфере машинного обучения, а также Tech Mahindra, предоставляющая возможность кросс-партнерства с помощью интеграции нашего продукта в свою систему.

Чем занимаемся и что планируем?

Наш главный план на 2020 — выпустить MVP для первых клиентов. За последнее время наша команда произвела достаточно большое количество исследований, который необходимо трансформировать в рабочий функционал и заделиверить в продукт.

Основной фокус наших исследований — unsupervised learning во всех его проявлениях. А именно: поиск аномалий и concept drift detection, визуализация данных высокой размерности, а также автоматизация этих задач. Занимаемся оценкой разных методов: ищем научные статьи, имплементируем, оцениваем их работу. После успешных экспериментов разрабатываем фичи.

Мы одними из первыми нашли на рынке нишу machine learning model monitoring. То, что мы движемся в правильном направлении, доказывают новые компании-конкуренты, начинающие разработки в этой сфере.

Какой технологический стек проекта?

Технологический стек Hydrosphere, как у любого уважающего себя стартапа, включает в себя последние версии технологий и большое количество Data Science.

Front-end:

  • Angular

Back-end:

  • Scala
  • Python
  • Flask
  • Mongo

ML Engineer:

  • Python
  • Numpy
  • Celery
  • Knowledge & experience with unsupervised methods.

Other technologies:

  • Kubernetes, Docker, AWS, эффекты, стримы (Cats, fs2, ZIO), акторы, PSQL (Hikari, Flyway, doobie/ Slick), Mongo, HTTP (Akka HTTP, Http4s, Finch, Play, etc.), gRPC.

В чем преимущества работы на проекте Hydrosphere?

1

Все плюсы работы в стартапе: у нас нет legacy кода, есть возможностями для экспериментов и использования новых топовых технологий.

2

Разрабатываем совершенно новый продукт, который еще никто никогда до этого не разрабатывал.

3

У нас можно приносить пользу разными способами: у участников команды нет одной ограниченной роли. Хочешь быть человеком-мультитулом, будь им.

4

Возможность использовать удобную методологию и трекеры эффективности, самостоятельно выстраивать свой график.

5

Возможность применить навыки ресерча и имплементировать их в реальном продукте.

Q&A по проекту Hydrosphere

Есть ли тестовое задание?

Тестового задания нет, ориентируемся на необходимые навыки кандидата.

Какие качества важны для кандидата?

Для ML Engineer: кандидат должен обладать хорошими навыками ресерча: необходимо уметь разбирать научные статьи и воспроизводить их.
Для разработчиков: базовые знания в ML будут несомненным плюсом для инженеров.

Какой график работы?

График работы гибкий. Возможна частично удаленная занятость.

Какую методологию использует команда?

Используем Kanban и Github Projects как трекер. Не используем Jira.

Нужен ли английский для работы на проекте?

Да, важно хорошее понимание английского для работы с научными статьями. Необходимый уровень не ниже Upper-Intermediate.

Есть ли перспектива командировок?

Командировки вероятны.

Напишите нам на jobs@provectus.com и мы расскажем вам о проекте Hydrosphere подробнее.

Close
Upload CV
  • Accepted file types: txt, rtf, dot, doc, docx, ppt, pptx, xls, xlsx, pdf, png, jpg.
  • This field is for validation purposes and should be left unchanged.

Я даю разрешение на обработку моих персональных данных и согласен с политикой конфиденциальности сайта.