Ingegnere AI – Specialista LLM

Luogo: Davos, Svizzera, ibrido
Il tuo profilo

Stiamo cercando un ingegnere AI esperto con una forte attenzione al collaudo, alla valutazione e all'operatività dei modelli linguistici di grandi dimensioni (LLM) che si unisca al nostro team in crescita. In questo ruolo, ti assicurerai che i nostri modelli linguistici soddisfino elevati standard di accuratezza, robustezza, sicurezza e prestazioni e che si integrino perfettamente nel nostro panorama di applicazioni basate su Speech-to-Text e AI.

Lavorerai a stretto contatto con ingegneri di prodotto, full-stack e infrastruttura per trasformare modelli linguistici all'avanguardia in sistemi affidabili e pronti per la produzione che risolvano i problemi reali dei clienti. Renderai i prototipi pronti per la produzione.

Responsabilità principali

Valutazione e test LLM

  • Progettare e mantenere quadri di valutazione sistematici per gli LLM, tra cui:
    • Suite di test automatizzate
    • Set di dati d'oro
    • Benchmark di regressione
  • Definire metriche quantitative (ad es. accuratezza, latenza, tasso di allucinazione, successo dell'attività) e protocolli di valutazione qualitativa.
  • Eseguire analisi degli errori e indagini sulle cause alla radice dei guasti dei modelli.

Allineamento e ottimizzazione delle attività

  • Focus sulla prototipazione rapida e sull'operatività dei casi d'uso dei clienti
  • Migliora le prestazioni del modello su attività specifiche utilizzando un flusso di lavoro prompt-first (prompt di sistema, esempi few-shot, istruzioni degli strumenti).
  • Costruisci e ripeti i set di valutazione; esegui esperimenti per misurare qualità, latenza e costi.
  • Curare set di dati ad alto segnale per l'ottimizzazione automatizzata dei prompt (pulizia, etichettatura, filtraggio, aumento).
  • Applicare un adattamento leggero quando vantaggioso (ottimizzazione rapida, metodi efficienti in termini di parametri come LoRA/adattatori).
  • Utilizza la messa a punto supervisionata / messa a punto delle istruzioni quando i metodi prompt e leggeri non raggiungono l'obiettivo.
  • Preparare e curare i set di dati di addestramento (pulizia, etichettatura, aumento, filtraggio).

Selezione dei modelli e sperimentazione

  • Valutare e confrontare LLM open source e commerciali per casi d'uso specifici.
  • Esperimenti controllati di progettazione (test A/B, valutazioni offline).
  • Documentare i risultati e raccomandare le scelte relative al modello.

Integrazione nel prodotto

  • Collabora con ingegneri full-stack per integrare prototipi in prodotti, servizi di backend e applicazioni rivolte agli utenti.
  • Supporto alla progettazione dell'API per l'inferenza del modello e la post-elaborazione.
  • Garantire che i modelli funzionino in modo affidabile nei flussi di lavoro in tempo reale e in batch.

Qualità, sicurezza e misure di protezione

  • Implementare meccanismi per:
  • Ridurre le allucinazioni
  • Formati di output applicati
  • Applica filtri di contenuto
  • Rilevare e gestire risultati non sicuri o poco affidabili

Ottimizzazione delle prestazioni e dei costi

  • Ottimizza la latenza di inferenza e il throughput.
  • Bilanciare le dimensioni del modello, la quantizzazione, il batching e le strategie di caching.
  • Monitorare e ottimizzare i costi di inferenza.

MLOps e gestione del ciclo di vita

  • Modelli di versione, set di dati, prompt e risultati della valutazione.
  • Supportare le pipeline di distribuzione per le nuove versioni del modello.
  • Monitorare le prestazioni del modello in produzione e rilevare eventuali scostamenti.

Collaborazione e condivisione delle conoscenze

  • Collaborare strettamente con i product manager per tradurre i requisiti in comportamenti modello.
  • Supportare i team interni con indicazioni sulla progettazione tempestiva e sull'utilizzo dei modelli.
  • Contribuisci alla documentazione e alle migliori pratiche interne.

Strategia e governance dei dati

  • Definire standard per la qualità dei set di dati, linee guida per l'etichettatura e l'archiviazione.
  • Mantenere la tracciabilità tra set di dati, esperimenti e modelli implementati.

Generazione di dati sintetici

  • Utilizza LLM o altre tecniche per generare dati di addestramento sintetici laddove i dati reali sono scarsi.

LLM agentici

  • Progetta e testa flussi di lavoro LLM che richiamano strumenti, funzioni o API esterne.

Flussi di lavoro Human-in-the-Loop

  • Progettare cicli di feedback in cui revisori umani convalidano o correggono i risultati del modello.

Ricerca scouting

  • Tieni traccia di documenti, framework e progetti open source rilevanti.
  • Prototipare rapidamente tecniche promettenti.

Abilitazione interna

  • Creare linee guida interne per la scrittura e la valutazione tempestive.
  • Organizza sessioni occasionali di condivisione delle conoscenze.
Cosa portare

Esperienza AI / ML

  • Almeno 3-5 anni di esperienza nel machine learning o nell'intelligenza artificiale applicata.
  • Esperienza pratica nell'utilizzo di LLM nella produzione o in prototipi avanzati.

Formazione dei modelli e messa a punto

  • Esperienza con PyTorch o TensorFlow.
  • Familiarità con le tecniche di ottimizzazione e i processi di formazione.

Valutazione e sperimentazione

  • Ottima comprensione della progettazione sperimentale.
  • Esperienza nella realizzazione di sistemi di valutazione.

Competenze di programmazione

  • Ottima conoscenza di Python.
  • Familiarità con le API REST e l'integrazione backend.

Gestione dei dati e MLOps

  • Esperienza con la pre-elaborazione dei set di dati, le pipeline di etichettatura e il versioning.
  • Familiarità con Docker, CI/CD e implementazione dei modelli.

Mentalità analitica

  • Capacità di ragionare sul comportamento del modello e sulle modalità di guasto.

Comunicazione

  • Buone capacità di comunicazione verbale e scritta in inglese e tedesco.
  • Mentalità da startup
  • A proprio agio con l'ambiguità, iterazioni rapide e alto senso di responsabilità.
Cosa offriamo
  • Possibilità di partecipare al programma di partecipazione azionaria di AlpineAI dopo il periodo iniziale.
  • Cultura dinamica e orientata all'innovazione.
  • Elevata autonomia e impatto reale sul prodotto.
  • Stretta collaborazione con esperti in linguistica, PNL e IA applicata.
  • Esposizione alle tecnologie AI all'avanguardia.
  • Ruolo in loco a Zurigo o Davos

Non candidarti se

  • Non sei disposto a lavorare in loco a Zurigo o Davos.
  • Non disponi di un permesso di lavoro per la Svizzera.
  • Non avete mai lavorato in un ambiente di startup.
Chi siamo

Per ulteriori informazioni su AlpineAI, visitare il sito: https://alpineai.swiss

Sei pronto ad aiutare i clienti ad avere successo con l'IA? Candidati ora inviando il tuo CV e una breve lettera di presentazione. Non vediamo l'ora di conoscerti.

Contatto:

Dr. Daniela Suter, hr@alpineai.ch