Apertus: la nuova IA svizzera che parla anche romancio

A settembre 2025, i due politecnici federali svizzeri e il loro partner CSCS hanno lanciato il modello linguistico Apertus. È stato addestrato con parole provenienti da 1’800 lingue, tra cui svizzero tedesco e romancio. Apertus è ancora criticato per i suoi errori, ma secondo gli esperti va semplicemente lasciato crescere.

Ci troviamo nel campus dell’École polytechnique fédérale de Lausanne (EPFL), dove incontriamo Antoine Bosselut, specialista in intelligenza artificiale (IA) e aspetti multilingue nei grandi modelli linguistici, spesso indicati in inglese come “Large Language Models” o LLM. Questi sistemi di IA, addestrati con miliardi di dati, sono in grado di rispondere a innumerevoli domande, proprio come ChatGPT. Nato in Francia e formato negli Stati Uniti, il professore trentaquattrenne sa molto su come sviluppare macchine capaci di gestire lingue così diverse come il tibetano o il romancio. È uno degli sviluppatori della nuova IA svizzera: Apertus.

All’inizio di settembre, i due politecnici federali e il Centro svizzero di calcolo scientifico (CSCS) hanno annunciato il lancio del primo LLM multilingue open-source sviluppato in Svizzera. «Apertus rappresenta un passo importante per la trasparenza e la diversità nell’intelligenza artificiale generativa», hanno dichiarato i suoi creatori. In cosa si differenzia questo nuovo LLM svizzero da Llama 4 (sviluppato da Meta), Grok (prodotto da Elon Musk) o ChatGPT, un sistema di IA completo?

Gli elementi che compongono il modello svizzero – algoritmi e parametri di calcolo – sono liberamente accessibili, così come le istruzioni d’uso, mentre ad esempio ChatGPT si basa su un modello commerciale meno trasparente. Un’altra differenza è che Apertus non è un sistema universale. «Per alcuni scopi specifici, i modelli commerciali non sono sufficientemente specializzati. E vale la regola: più un’IA è specializzata, più è potente», spiega Antoine Bosselut. Gli ospedali potrebbero utilizzare Apertus – algoritmi e sistema di calcolo – per addestrare il modello ad analizzare migliaia di radiografie. Infatti, l’IA, può individuare differenze nei dati quasi invisibili all’occhio umano.

La ricerca di dati affidabili

Il supercomputer del CSCS ha addestrato Apertus con miliardi di dati tratti da Internet, che costituiscono il suo sapere di base. L’EPFL sottolinea che per questo modello sono stati considerati solo dati i cui proprietari non vietano esplicitamente l’uso da parte di “crawler”, robot che analizzano il web. «Se, ad esempio, il New York Times vieta l’accesso ai propri articoli a certi crawler, escludiamo tale fonte dai nostri dati», spiega Bosselut. Per addestrare Apertus sono state utilizzate 15 miliardi di parole provenienti da 1’800 lingue (Internet ne contiene circa 50’000 miliardi). Gli sviluppatori garantiscono agli utenti futuri – ad esempio le aziende – l’affidabilità dei dati in termini etici e legali, mentre i fornitori di IA commerciali rifiutano di rendere pubblici i dati di addestramento.

In genere, i grandi modelli si concentrano sulle lingue storicamente presenti sul web – inglese, francese, cinese, giapponese ecc. Il LLM svizzero, invece, ha raccolto dati di lingue scarsamente rappresentate su Internet, come tibetano, yoruba, svizzero tedesco e romancio. Poiché queste lingue sono poco parlate online, i contenuti sono stati ricavati partendo da lingue affini. Il concetto è che il modello possa apprendere il romancio nonostante pochi dati, perché è stato anche addestrato sull’italiano, con cui condivide somiglianze, spiega Bosselut. Quali applicazioni immaginano gli sviluppatori? Un esempio: Apertus è stato adottato da una scuola in Nigeria, che ora può sviluppare corsi basati su una lingua normalmente poco rappresentata negli altri modelli. Questo si allinea chiaramente all’obiettivo dell’EPFL di «democratizzare l’IA».

La città di Zurigo utilizza Apertus

Per il suo sviluppo, il LLM svizzero è stato messo alla prova in “hackathon”, una sorta di competizione per testare i sistemi. Gli studenti hanno utilizzato lo strumento per sviluppare servizi, ad esempio un’interfaccia per facilitare l’apprendimento del tibetano. Alcuni hanno creato un sistema chiamato “Mut zur Lücke” che mostra agli studenti quali parti dei corsi possono saltare senza rischiare di non superare l’esame. Anche la città di Zurigo usa Apertus: «Sono ZüriCityGPT e so (quasi) tutto ciò che è pubblicato su stadt-zuerich.ch», si legge sul sito. Tuttavia, il sistema ha dei limiti. Quanti poliziotti armati ci sono in città? LLM risponde: Apertus «purtroppo non può aiutare». ChatGPT è leggermente più preciso: «Circa 1’700 funzionari sono autorizzati a portare armi di servizio. Non esiste però una fonte ufficiale sul numero di chi le porta in maniera continua». Curiosamente, Apertus è stato lanciato senza un’interfaccia per creare “prompt”.

Questo non era l’obiettivo: i creatori vogliono che il modello serva come materia prima. Chiunque può però testare Apertus tramite un software sviluppato da un’organizzazione non-profit americana: https://publicai.co.

Errori e critiche

In Svizzera, i primi commenti evidenziavano errori grossolani. «Mi hanno detto che il castello di Chillon era originariamente un piccolo villaggio fortificato su un promontorio calcareo in mezzo al lago», ha ironizzato su LinkedIn il giornalista romando François Pilet, fondatore del sito investigativo Gottham City. Anche il rapporto costi-benefici dell’iniziativa lo sorprende: «I politecnici hanno appena triplicato le rette per gli studenti stranieri, e contemporaneamente non hanno problemi a spendere 10 milioni di franchi per finanziare qualcosa che alla fine si rivela arte contemporanea!». L’attacco ad Apertus ha attirato l’attenzione di esperti come Maxime Derian, francese, specialista di IA: «I modelli open-source americani e cinesi ci sono davanti di un passo. E allora? Anche i primi modelli di quei paesi erano tutt’altro che perfetti. Il modello svizzero è stato sviluppato localmente: le versioni successive miglioreranno e tra due o tre anni saranno altrettanto rilevanti». Il fatto che Apertus commetta ancora errori è dovuto al fatto che finora non è stato sufficientemente addestrato e dispone di pochi dati. Bosselut concorda: «Abbiamo fatto la parte più costosa, cioè sviluppo e addestramento del modello. Ora è disponibile gratuitamente per tutti gli utenti futuri».

Stéphane Herzog