Инженер
Andrew Petushkov
180 000 – 250 000 ₽
Описание вакансии
Ищем Backend / ML Infrastructure / MLOps инженера в проект — ИИ-ассистент по судебной практике РФ (SaaS для юристов). Делаем понятный по архитектуре продукт: собираем RAG из массива документов судов РФ и подключаем к нему self-host LLM с инструментами. Пользователь формулирует запрос обычным языком и получает развёрнутый ответ со ссылками на конкретные дела. Прототип уже работает, парсинг и индексация идут — задача финально собрать продукт. Стек: Python и TypeScript, Postgres, Qdrant (vector search), embeddings, RAG + Reranking (Qwen), self-host LLM-инференс на собственных GPU, S3 (Backblaze B2), Sentry. Что уже готово: — Поиск судебной практики по смыслу, подбор похожих дел, разбор позиции судов, резюме конкретных дел. Частично готово: аналитика по инстанциям и судьям; ссылки на конкретные дела. Что предстоит доделать (зона работы): — Статистические тулы для профилирования акторов — Довести до ума инфраструктуру — Генерация процессуальных документов (иски, жалобы, претензии) с экспортом в .docx/.pdf — Сборка RAG + reranking в продакшн и стабильный self-host LLM-инференс — API, мониторинг и логи качества ответов, нагрузочная стабильность. Кого ищем: middle / junior-to-middle, уверенный Python (TypeScript — плюс). Главное — умение разобраться в существующем коде и доводить фичи до прода. Опыт с RAG / LLM / vector search / парсингом больших текстовых массивов — большой плюс. Есть подробный бэклог и ведущий разработчик, который прособеседует и введёт в задачи.