🎯 К каким бизнес-метрикам привязывают HR-бренд?

Проводим исследование и будем рады поговорить с теми, кто отвечает за репутацию работодателя. За участие дарим записи Хабрасеминара!

→ Пройти опрос и забрать записи

Data Scientist Middle

от 120 000 до 150 000 ₽

Требования

Ученый по данным
Middle
SQL
Python
NLP
Большие данные
Базы данных
Машинное обучение
Анализ данных
Jupyter Notebook

Условия

Можно удалённо

Компания

Разработка стартапов с искусственным интеллектом

Описание вакансии

О компании и команде

Мы вошли в топ лучших it-работодателей России 2025 на Хабр Карьере.  В Strikt мы превращаем хаотичные бизнес-процессы наших заказчиков в четкие, самообучающиеся алгоритмы с использованием ИИ.  Ищем к нам в команду Data Scientist для работы над интересными проектами в областях AdTech, HealthTech, Machine Learning!

Чем предстоит заниматься

  • Разрабатывать ML-модели для анализа текстовых и табличных данных.
  • Работать с NLP-задачами: предобработка текста, эмбеддинги, классификация, кластеризация.
  • Применять классические ML-алгоритмы: линейные модели, деревья решений, ансамбли, clustering.
  • Использовать современные NLP-модели и подходы: BERT, RoBERTa, sentence embeddings, GPT/LLM.
  • Работать с SQL и Python для извлечения, очистки, анализа и визуализации данных.
  • Оценивать качество моделей, подбирать метрики, анализировать ошибки и предлагать улучшения.

Что мы ожидаем

  • Высшее техническое или математическое образование.
  • 1–3 года коммерческого опыта в Data Science.
  • Знания в области машинного обучения и анализа данных.
  • Понимание ключевых алгоритмов ML: линейные модели, деревья решений, ансамбли.
  • Опыт работы с методами кластеризации: KMeans, DBSCAN и их применением к текстовым данным.
  • Понимание принципов скользящего окна и его применения в анализе последовательностей.
  • Уверенный Python и библиотеки: pandas, numpy, matplotlib, scikit-learn.
  • Опыт работы с Jupyter Notebook.
  • Знания NLP и понимание работы трансформеров: BERT, RoBERTa.
  • Знание SQL и понимание реляционных БД.
  • Умение работать с большими объёмами данных и оптимизировать производительность моделей.

Будет плюсом

  • Опыт работы с LLM/GPT, RAG, embeddings или vector databases.
  • Опыт с PyTorch / TensorFlow / Hugging Face.
  • Понимание базовых принципов MLOps: версионирование моделей, мониторинг качества, drift.
  • Понимание CI/CD и Git.
  • Английский язык на уровне чтения технической документации.

Условия работы

  • Полностью удалённая работа;
  • Оформление по договору с самозанятыми, ИП;
  • Интересные проекты;
  • Возможность профессионального роста и развития в сильной команде специалистов.