🌍 L'entreprise
Scale-up MedTech basée à Paris, pionnière de l'IA appliquée à la biologie médicale en Europe. Leur plateforme transforme des données biologiques complexes en insights actionnables pour des millions d'utilisateurs — patients et professionnels de santé confondus.
Les modèles sont déjà en production à grande échelle. L'enjeu aujourd'hui : passer à la vitesse supérieure — architectures plus robustes, systèmes GenAI plus fiables, coûts maîtrisés, hallucinations réduites au maximum. Dans un contexte médical, la performance n'est pas optionnelle.
🚀 Le rôle
Tu rejoins une équipe Data en pleine structuration, composée de profils pointus — chercheurs, ingénieurs, experts NLP. L'ambiance est exigeante et stimulante. Ce qu'on cherche : quelqu'un qui sait autant lire un papier que livrer en prod. Pas six jours sur le modèle parfait — le meilleur modèle qui tourne aujourd'hui.
Tes missions :
- Construire et déployer des systèmes GenAI en production — RAG, pipelines LLM, agents multi-steps
- Fine-tuner des LLMs open source (LoRA, PEFT, QLoRA) sur des données médicales sensibles
- Optimiser les performances à scale : latence (KV cache, quantisation 4/8 bits), coûts d'inférence, guardrails anti-hallucinations
- Concevoir des architectures robustes et traçables (systèmes hybrides règles + ML si pertinent)
- Contribuer aux choix techniques avec Stan et l'équipe — ta voix compte dès le premier jour
- Participer à la structuration des données et au monitoring continu des modèles
🧠Profil recherché
Tu comprends ce que tu fais — mathématiquement et techniquement. Tu peux expliquer pourquoi un Transformer fonctionne, pas juste comment l'utiliser. Tu sais ce que Q, K, V veulent dire. Et surtout, tu as envie que ça marche en vrai, pas juste dans un notebook.
Must-have :
- 5 à 8+ ans d'expérience en ML / NLP / GenAI — en contexte produit, pas uniquement recherche
- Maîtrise des Transformers en profondeur : architecture, attention, fine-tuning (LoRA / PEFT / QLoRA)
- RAG en production (pas juste POC) — chunking, embeddings, vector DB
- Mise en prod à scale : monitoring, optimisation coûts, gestion de la latence
- Python expert + PyTorch / TensorFlow
- Stack cloud : AWS, GCP ou Azure + Docker + FastAPI
Nice to have :
- Expérience données de santé / environnement réglementé (RGPD, données sensibles)
- Background scientifique fort : PhD, INRIA, CEA ou équivalent
- MLOps / MLflow
- Computer Vision + NLP (multimodal)
- Expérience systèmes hybrides (ML + règles métier)
Ce qu'on ne veut pas : Un profil qui utilise LangChain sans savoir ce qui se passe dessous. Un profil qui n'a fait que des POC sans jamais livrer. Un profil avec un ego qui dépasse la pièce.
đź’Ľ Ce que l'entreprise offre
- 65–90k€ selon profil + equity possible
- Équipe technique senior et exigeante — tu apprendras autant que tu apporteras
- Problématiques concrètes à grande échelle dans un secteur à fort impact
- Environnement hybride — Paris
- Accès direct aux décideurs, ownership réel dès le départ
Match votre profil
POSTULER