Qwen 3.5 di Alibaba: Il Modello IA che Sfida GPT-5 e Claude Opus con il 95% di Memoria in Meno
Alibaba Cloud segna un colpo importante. Il 16 febbraio 2026, il gigante cinese ha presentato [Qwen](https://qwen.ai) 3.5 — un modello di intelligenza artificiale che dichiara di superare GPT-5.2, Claude Opus 4.5 e Gemini 3 Pro nell'80% dei benchmark valutati, consumando il 95% di memoria in meno rispetto a un modello denso equivalente.
Com'è possibile? Grazie a un'architettura Mixture-of-Experts (MoE) che incorpora 397 miliardi di parametri ma ne attiva solo 17 miliardi per ogni richiesta. Il risultato: prestazioni di punta a un costo irrisorio — 1 milione di token per 0,18$.
Analisi di un modello che potrebbe ridistribuire le carte del mercato dell'IA.
L'architettura MoE: il segreto di Qwen 3.5
Per capire perché Qwen 3.5 è notevole, bisogna comprendere l'architettura Mixture-of-Experts (Miscela di Esperti). Immaginate uno studio con 397 esperti. Per ogni domanda, invece di consultarne 397, ne sollecitate solo 17 — i più pertinenti per il vostro problema. Risultato: la stessa qualità di risposta, ma molte meno risorse consumate.
È esattamente quello che fa Qwen 3.5. Il modello combina:
- 397 miliardi di parametri totali — la conoscenza completa del modello
- 17 miliardi attivati per richiesta — solo gli esperti pertinenti vengono sollecitati
- Attenzione ibrida — mix di gated linear attention e sparse expert routing
- Addestramento nativo FP8 — riduzione del 50% della memoria di attivazione
Benchmark: Qwen 3.5 contro i giganti
Alibaba rivendica prestazioni superiori a GPT-5.2, Claude Opus 4.5 e Gemini 3 Pro nell'80% dei benchmark valutati. Ecco i punteggi chiave:
| Benchmark | Punteggio Qwen 3.5 | Categoria |
|---|---|---|
| AIME26 | 91,3 | Matematica Olimpiadi |
| MathVista | 90,3 | Ragionamento matematico |
| GPQA Diamond | 88,4 | Ragionamento livello dottorato |
| MMLU | 88,5 | Conoscenze generali |
| MMLU-Pro | 87,8 | Conoscenze multilingue |
| LiveCodeBench v6 | 83,6 | Generazione di codice |
| BFCL v4 | 72,9 | Utilizzo di strumenti |
Questi risultati collocano Qwen 3.5 al livello dei migliori modelli mondiali, pur essendo open-weight (pesi aperti) con licenza Apache 2.0. È un argomento di peso rispetto ai modelli chiusi di OpenAI e Anthropic.
Multimodalità nativa: testo, immagini, audio e video
Qwen 3.5 è il primo modello della famiglia Qwen a offrire una multimodalità nativa. A differenza dei modelli che trattano separatamente testo e immagini, Qwen 3.5 integra nativamente:
- Testo — Comprensione e generazione in 201 lingue e dialetti
- Immagini — Analisi di immagini fino a 1344x1344 pixel di risoluzione
- Audio — Elaborazione dell'audio nativamente integrata
- Video — Analisi di clip video fino a 2 ore
Questa capacità multimodale, combinata con una finestra di contesto di 256.000 token (1 milione per la versione ospitata Qwen 3.5-Plus), ne fa uno strumento potente per i casi d'uso aziendali che mescolano diversi tipi di contenuto.
Qwen3-Coder-Next: l'asso del codice
Parallelamente a Qwen 3.5, Alibaba ha lanciato Qwen3-Coder-Next — un modello specializzato nel codice che fa girare la testa alla comunità degli sviluppatori. Con 80 miliardi di parametri (3B attivati per token), raggiunge prestazioni comparabili a modelli 10-20 volte più grandi:
| Benchmark | Punteggio | Comparabile a |
|---|---|---|
| SWE-Bench Verified | 74,2% | Claude Sonnet 4.5 |
| Aider (assistente codice) | 69,9% | Top tier |
| SWE-Bench Multilingual | 63,7% | — |
| SWE-Bench Pro | 44,3% | — |
| Terminal-Bench 2.0 | 39,3% | — |
La cosa più impressionante? Qwen3-Coder-Next gira su hardware consumer: un MacBook con 64 GB di RAM, una RTX 5090 o una AMD Radeon 7900 XTX sono sufficienti. È un argomento decisivo per gli sviluppatori che vogliono un copilota di codice locale, senza dipendere dal cloud.
IA agentica: Qwen 3.5 progettato per gli agenti
Qwen 3.5 non è solo un modello conversazionale. È stato specificamente progettato per l'IA agentica — la capacità di eseguire compiti in modo autonomo su applicazioni mobile e desktop con comprensione visiva.
Il modello integra nativamente:
- Chiamate di strumenti strutturate — Invocazione di funzioni e orchestrazione nativa
- Navigazione visiva — Comprensione dell'interfaccia per interagire con le applicazioni
- Workflow autonomi — Concatenazione di compiti senza intervento umano
- Recupero in caso di errore — Adattamento quando un piano non funziona
È un posizionamento strategico: mentre ChatGPT e Claude aggiungono capacità agentiche sopra i loro modelli conversazionali, Qwen 3.5 è stato progettato fin dall'inizio per questi usi.
Prezzi e disponibilitÃ
Due versioni di Qwen 3.5 sono disponibili:
| Versione | Parametri | Contesto | Prezzo | Licenza |
|---|---|---|---|---|
| Qwen 3.5 (open-weight) | 397B (17B attivi) | 256K token | Gratuito (self-hosted) | Apache 2.0 |
| Qwen 3.5-Plus (ospitato) | 397B+ (ottimizzato) | 1M token | ~0,18$/M token | API Alibaba Cloud |
I modelli sono disponibili su [Ollama](/en/companies/ollama), [LM Studio](/en/companies/lm-studio-inc), Together AI, OpenRouter e [Hugging Face](https://huggingface.co). La versione ospitata è accessibile tramite Alibaba Cloud Model Studio.
A titolo di confronto, il pricing di 0,18$ per milione di token è 30-50 volte meno caro rispetto alle tariffe di GPT-4 o Claude Opus per prestazioni annunciate comparabili. Se i benchmark si confermano, è uno sconvolgimento tariffario importante.
Qwen nella corsa mondiale all'IA
L'ascesa di Qwen è fulminea. A dicembre 2025, Qwen ha superato tutti gli altri modelli open source combinati in numero di download su Hugging Face. A gennaio 2026, Qwen-3 è diventato il primo modello IA operato in orbita. Con Qwen 3.5, Alibaba afferma la sua posizione di leader dell'IA open source mondiale.
Per gli utenti europei, Qwen rappresenta un'alternativa interessante ai modelli americani — anche se le questioni di sovranità dei dati rispetto alla Cina restano un tema di vigilanza, così come lo sono con i modelli americani.
Conclusione
Qwen 3.5 è un segnale forte inviato da Alibaba al resto del mondo: l'IA open source cinese non ha più nulla da invidiare ai modelli chiusi occidentali. Con prestazioni annunciate al livello di GPT-5.2 e Claude Opus 4.5, un'efficienza di memoria rivoluzionaria e un prezzo 30-50 volte inferiore, Qwen 3.5 potrebbe costringere gli attori consolidati a rivedere la loro strategia tariffaria.
Per le aziende e gli sviluppatori, è un'ottima notizia: più concorrenza significa strumenti migliori e prezzi più bassi. Il mercato dell'IA non è mai stato così dinamico.
FAQ
Confronta i modelli IA
ChatGPT, Claude, Gemini, Mistral, Qwen... trovate il modello che fa per voi.
Accedi al comparatoreFonti e riferimenti
Siti ufficiali e risorse :
- Claude — claude.ai
- Qwen — qwen.ai
- anthropic — anthropic.com
- openai — openai.com
- AMD — amd.com
- ChatGPT — chat.openai.com
- Hugging Face — huggingface.co
- ollama — ollama.com
Consulta le nostre schede dettagliate :






