Votre profil
Nous recherchons un ingénieur IA qualifié, spécialisé dans le test, l'évaluation et l'opérationnalisation des modèles linguistiques à grande échelle (LLM), pour rejoindre notre équipe en pleine expansion. À ce poste, vous veillerez à ce que nos modèles linguistiques répondent à des normes élevées en matière de précision, de robustesse, de sécurité et de performance, et qu'ils s'intègrent parfaitement dans notre environnement d'applications de reconnaissance vocale et d'IA.
Vous travaillerez en étroite collaboration avec les ingénieurs produit, full-stack et infrastructure afin de transformer des modèles linguistiques de pointe en systèmes fiables et prêts à être mis en production, capables de résoudre les problèmes concrets des clients. Vous préparez les prototypes pour la production.
Responsabilités clés
Évaluation et tests LLM
- Concevoir et maintenir des cadres d'évaluation systématiques pour les LLM, notamment :
- Suites de tests automatisés
- Ensembles de données en or
- Benchmarks de régression
- Définir des indicateurs quantitatifs (par exemple, précision, latence, taux d'hallucination, réussite des tâches) et des protocoles d'évaluation qualitative.
- Effectuer des analyses d'erreurs et des enquêtes sur les causes profondes des défaillances des modèles.
Alignement et optimisation des tâches
- Concentrez-vous sur le prototypage rapide et l'opérationnalisation des cas d'utilisation des clients.
- Améliorez les performances du modèle sur des tâches spécifiques à l'aide d'un flux de travail axé sur les invites (invites système, exemples en quelques essais, instructions d'utilisation des outils).
- Construisez et itérez des ensembles d'évaluation ; menez des expériences pour mesurer la qualité, la latence et le coût.
- Sélectionnez des ensembles de données à signal élevé pour une optimisation rapide et automatisée (nettoyage, étiquetage, filtrage, augmentation).
- Appliquer une adaptation légère lorsque cela est avantageux (réglage rapide, méthodes efficaces en termes de paramètres telles que LoRA/adaptateurs).
- Utilisez le réglage fin supervisé / le réglage par instruction lorsque les méthodes d'invite et légères n'atteignent pas l'objectif.
- Préparer et organiser des ensembles de données d'entraînement (nettoyage, étiquetage, augmentation, filtrage).
Sélection de modèles et expérimentation
- Évaluez et comparez les LLM open source et commerciaux pour des cas d'utilisation spécifiques.
- Expériences contrôlées de conception (tests A/B, évaluations hors ligne).
- Documenter les résultats et recommander des choix de modèles.
Intégration dans le produit
- Collaborez avec des ingénieurs full-stack pour intégrer des prototypes dans des produits, des services backend et des applications destinées aux utilisateurs.
- Conception d'API de prise en charge pour l'inférence et le post-traitement des modèles.
- Garantir la fiabilité des modèles dans les workflows en temps réel et par lots.
Qualité, sécurité et garde-corps
- Mettre en place des mécanismes pour :
- Réduire les hallucinations
- Formats de sortie imposés
- Appliquer des filtres de contenu
- Détecter et traiter les résultats non fiables ou peu fiables
Optimisation des performances et des coûts
- Optimisez la latence d'inférence et le débit.
- Équilibrer la taille du modèle, la quantification, le traitement par lots et les stratégies de mise en cache.
- Surveillez et optimisez les coûts d'inférence.
MLOps et gestion du cycle de vie
- Modèles de version, ensembles de données, invites et résultats d'évaluation.
- Prise en charge des pipelines de déploiement pour les nouvelles versions du modèle.
- Surveillez les performances des modèles en production et détectez les écarts.
Collaboration et partage des connaissances
- Travailler en étroite collaboration avec les chefs de produit afin de traduire les exigences en comportements modèles.
- Assister les équipes internes en leur fournissant des conseils sur la conception rapide et l'utilisation des modèles.
- Contribuer à la documentation et aux meilleures pratiques internes.
Stratégie et gouvernance des ensembles de données
- Définir des normes pour la qualité des ensembles de données, les directives d'étiquetage et le stockage.
- Maintenir la traçabilité entre les ensembles de données, les expériences et les modèles déployés.
Génération de données synthétiques
- Utilisez des LLM ou d'autres techniques pour générer des données d'entraînement synthétiques lorsque les données réelles sont rares.
LLM agentifs
- Concevez et testez des workflows LLM qui font appel à des outils, des fonctions ou des API externes.
Workflows « Human-in-the-Loop »
- Concevez des boucles de rétroaction dans lesquelles des évaluateurs humains valident ou corrigent les résultats du modèle.
Recherche de talents
- Suivez les articles, les cadres conceptuels et les projets open source pertinents.
- Prototyper rapidement les techniques prometteuses.
Habilitation interne
- Créer des directives internes pour la rédaction et l'évaluation rapides.
- Organisez occasionnellement des sessions de partage des connaissances.
What You Bring
Expérience en IA / ML
- Au moins 3 à 5 ans d'expérience dans le domaine de l'apprentissage automatique ou de l'IA appliquée.
- Expérience pratique dans l'utilisation des LLM en production ou dans des prototypes avancés.
Formation des modèles et ajustements
- Expérience avec PyTorch ou TensorFlow.
- Connaissance des techniques de réglage fin et des pipelines de formation.
Évaluation et expérimentation
- Solide compréhension de la conception expérimentale.
- Expérience dans la conception de harnais d'évaluation.
Compétences en programmation
- Solides compétences en Python.
- Connaissance des API REST et de l'intégration backend.
Traitement des données et MLOps
- Expérience dans le prétraitement des ensembles de données, les pipelines d'étiquetage et la gestion des versions.
- Connaissance de Docker, CI/CD et du déploiement de modèles.
Esprit analytique
- Capacité à raisonner sur le comportement des modèles et les modes de défaillance.
Communication
- Bonne communication orale et écrite en anglais et en allemand.
- Esprit start-up
- À l'aise avec l'ambiguïté, l'itération rapide et un haut niveau d'appropriation.
Ce que nous proposons
- Possibilité de participer au programme d'actionnariat d'AlpineAI après la période d'initiation.
- Culture dynamique, axée sur l'innovation.
- Grande autonomie et impact réel sur le produit.
- Collaboration étroite avec des experts en reconnaissance vocale, en traitement du langage naturel et en intelligence artificielle appliquée.
- Exposition aux technologies d'IA de pointe.
- Rôle sur site à Zurich ou Davos
Ne postulez pas si
- Vous n'êtes pas disposé à travailler sur place à Zurich ou à Davos.
- Vous n'avez pas de permis de travail pour la Suisse.
- Vous n'avez jamais travaillé dans un environnement de start-up.
À propos de nous
Pour en savoir plus sur AlpineAI, rendez-vous sur : https://alpineai.swiss
Prêt à aider nos clients à réussir grâce à l'IA ? Postulez dès maintenant en envoyant votre CV et une courte lettre de motivation. Nous attendons votre candidature avec impatience.
Contact :
Dr Daniela Suter, hr@alpineai.ch
