Il tuo profilo
Stiamo cercando un ingegnere AI esperto con una forte attenzione al collaudo, alla valutazione e all'operatività dei modelli linguistici di grandi dimensioni (LLM) che si unisca al nostro team in crescita. In questo ruolo, ti assicurerai che i nostri modelli linguistici soddisfino elevati standard di accuratezza, robustezza, sicurezza e prestazioni e che si integrino perfettamente nel nostro panorama di applicazioni basate su Speech-to-Text e AI.
Lavorerai a stretto contatto con ingegneri di prodotto, full-stack e infrastruttura per trasformare modelli linguistici all'avanguardia in sistemi affidabili e pronti per la produzione che risolvano i problemi reali dei clienti. Renderai i prototipi pronti per la produzione.
Responsabilità principali
Valutazione e test LLM
- Progettare e mantenere quadri di valutazione sistematici per gli LLM, tra cui:
- Suite di test automatizzate
- Set di dati d'oro
- Benchmark di regressione
- Definire metriche quantitative (ad es. accuratezza, latenza, tasso di allucinazione, successo dell'attività) e protocolli di valutazione qualitativa.
- Eseguire analisi degli errori e indagini sulle cause alla radice dei guasti dei modelli.
Allineamento e ottimizzazione delle attività
- Focus sulla prototipazione rapida e sull'operatività dei casi d'uso dei clienti
- Migliora le prestazioni del modello su attività specifiche utilizzando un flusso di lavoro prompt-first (prompt di sistema, esempi few-shot, istruzioni degli strumenti).
- Costruisci e ripeti i set di valutazione; esegui esperimenti per misurare qualità, latenza e costi.
- Curare set di dati ad alto segnale per l'ottimizzazione automatizzata dei prompt (pulizia, etichettatura, filtraggio, aumento).
- Applicare un adattamento leggero quando vantaggioso (ottimizzazione rapida, metodi efficienti in termini di parametri come LoRA/adattatori).
- Utilizza la messa a punto supervisionata / messa a punto delle istruzioni quando i metodi prompt e leggeri non raggiungono l'obiettivo.
- Preparare e curare i set di dati di addestramento (pulizia, etichettatura, aumento, filtraggio).
Selezione dei modelli e sperimentazione
- Valutare e confrontare LLM open source e commerciali per casi d'uso specifici.
- Esperimenti controllati di progettazione (test A/B, valutazioni offline).
- Documentare i risultati e raccomandare le scelte relative al modello.
Integrazione nel prodotto
- Collabora con ingegneri full-stack per integrare prototipi in prodotti, servizi di backend e applicazioni rivolte agli utenti.
- Supporto alla progettazione dell'API per l'inferenza del modello e la post-elaborazione.
- Garantire che i modelli funzionino in modo affidabile nei flussi di lavoro in tempo reale e in batch.
Qualità, sicurezza e misure di protezione
- Implementare meccanismi per:
- Ridurre le allucinazioni
- Formati di output applicati
- Applica filtri di contenuto
- Rilevare e gestire risultati non sicuri o poco affidabili
Ottimizzazione delle prestazioni e dei costi
- Ottimizza la latenza di inferenza e il throughput.
- Bilanciare le dimensioni del modello, la quantizzazione, il batching e le strategie di caching.
- Monitorare e ottimizzare i costi di inferenza.
MLOps e gestione del ciclo di vita
- Modelli di versione, set di dati, prompt e risultati della valutazione.
- Supportare le pipeline di distribuzione per le nuove versioni del modello.
- Monitorare le prestazioni del modello in produzione e rilevare eventuali scostamenti.
Collaborazione e condivisione delle conoscenze
- Collaborare strettamente con i product manager per tradurre i requisiti in comportamenti modello.
- Supportare i team interni con indicazioni sulla progettazione tempestiva e sull'utilizzo dei modelli.
- Contribuisci alla documentazione e alle migliori pratiche interne.
Strategia e governance dei dati
- Definire standard per la qualità dei set di dati, linee guida per l'etichettatura e l'archiviazione.
- Mantenere la tracciabilità tra set di dati, esperimenti e modelli implementati.
Generazione di dati sintetici
- Utilizza LLM o altre tecniche per generare dati di addestramento sintetici laddove i dati reali sono scarsi.
LLM agentici
- Progetta e testa flussi di lavoro LLM che richiamano strumenti, funzioni o API esterne.
Flussi di lavoro Human-in-the-Loop
- Progettare cicli di feedback in cui revisori umani convalidano o correggono i risultati del modello.
Ricerca scouting
- Tieni traccia di documenti, framework e progetti open source rilevanti.
- Prototipare rapidamente tecniche promettenti.
Abilitazione interna
- Creare linee guida interne per la scrittura e la valutazione tempestive.
- Organizza sessioni occasionali di condivisione delle conoscenze.
Cosa portare
Esperienza AI / ML
- Almeno 3-5 anni di esperienza nel machine learning o nell'intelligenza artificiale applicata.
- Esperienza pratica nell'utilizzo di LLM nella produzione o in prototipi avanzati.
Formazione dei modelli e messa a punto
- Esperienza con PyTorch o TensorFlow.
- Familiarità con le tecniche di ottimizzazione e i processi di formazione.
Valutazione e sperimentazione
- Ottima comprensione della progettazione sperimentale.
- Esperienza nella realizzazione di sistemi di valutazione.
Competenze di programmazione
- Ottima conoscenza di Python.
- Familiarità con le API REST e l'integrazione backend.
Gestione dei dati e MLOps
- Esperienza con la pre-elaborazione dei set di dati, le pipeline di etichettatura e il versioning.
- Familiarità con Docker, CI/CD e implementazione dei modelli.
Mentalità analitica
- Capacità di ragionare sul comportamento del modello e sulle modalità di guasto.
Comunicazione
- Buone capacità di comunicazione verbale e scritta in inglese e tedesco.
- Mentalità da startup
- A proprio agio con l'ambiguità, iterazioni rapide e alto senso di responsabilità.
Cosa offriamo
- Possibilità di partecipare al programma di partecipazione azionaria di AlpineAI dopo il periodo iniziale.
- Cultura dinamica e orientata all'innovazione.
- Elevata autonomia e impatto reale sul prodotto.
- Stretta collaborazione con esperti in linguistica, PNL e IA applicata.
- Esposizione alle tecnologie AI all'avanguardia.
- Ruolo in loco a Zurigo o Davos
Non candidarti se
- Non sei disposto a lavorare in loco a Zurigo o Davos.
- Non disponi di un permesso di lavoro per la Svizzera.
- Non avete mai lavorato in un ambiente di startup.
Chi siamo
Per ulteriori informazioni su AlpineAI, visitare il sito: https://alpineai.swiss
Sei pronto ad aiutare i clienti ad avere successo con l'IA? Candidati ora inviando il tuo CV e una breve lettera di presentazione. Non vediamo l'ora di conoscerti.
Contatto:
Dr. Daniela Suter, hr@alpineai.ch
