Qwen 3.5 di Alibaba: Il Modello IA che Sfida GPT-5 e Claude Opus con il 95% di Memoria in Meno

Alibaba Cloud segna un colpo importante. Il 16 febbraio 2026, il gigante cinese ha presentato [Qwen](https://qwen.ai) 3.5 — un modello di intelligenza artificiale che dichiara di superare GPT-5.2, Claude Opus 4.5 e Gemini 3 Pro nell'80% dei benchmark valutati, consumando il 95% di memoria in meno rispetto a un modello denso equivalente.

Com'è possibile? Grazie a un'architettura Mixture-of-Experts (MoE) che incorpora 397 miliardi di parametri ma ne attiva solo 17 miliardi per ogni richiesta. Il risultato: prestazioni di punta a un costo irrisorio — 1 milione di token per 0,18$.

Analisi di un modello che potrebbe ridistribuire le carte del mercato dell'IA.

L'architettura MoE: il segreto di Qwen 3.5

Per capire perché Qwen 3.5 è notevole, bisogna comprendere l'architettura Mixture-of-Experts (Miscela di Esperti). Immaginate uno studio con 397 esperti. Per ogni domanda, invece di consultarne 397, ne sollecitate solo 17 — i più pertinenti per il vostro problema. Risultato: la stessa qualità di risposta, ma molte meno risorse consumate.

È esattamente quello che fa Qwen 3.5. Il modello combina:

397 miliardi di parametri totali — la conoscenza completa del modello
17 miliardi attivati per richiesta — solo gli esperti pertinenti vengono sollecitati
Attenzione ibrida — mix di gated linear attention e sparse expert routing
Addestramento nativo FP8 — riduzione del 50% della memoria di attivazione

In pratica

Qwen 3.5 raggiunge 45 token/secondo su 8 GPU H100, con una decodifica 8,6 volte più veloce a 32K token di contesto e fino a 19 volte più veloce a 256K token. È una rivoluzione di efficienza.

Benchmark: Qwen 3.5 contro i giganti

Alibaba rivendica prestazioni superiori a GPT-5.2, Claude Opus 4.5 e Gemini 3 Pro nell'80% dei benchmark valutati. Ecco i punteggi chiave:

Benchmark	Punteggio Qwen 3.5	Categoria
AIME26	91,3	Matematica Olimpiadi
MathVista	90,3	Ragionamento matematico
GPQA Diamond	88,4	Ragionamento livello dottorato
MMLU	88,5	Conoscenze generali
MMLU-Pro	87,8	Conoscenze multilingue
LiveCodeBench v6	83,6	Generazione di codice
BFCL v4	72,9	Utilizzo di strumenti

Questi risultati collocano Qwen 3.5 al livello dei migliori modelli mondiali, pur essendo open-weight (pesi aperti) con licenza Apache 2.0. È un argomento di peso rispetto ai modelli chiusi di OpenAI e Anthropic.

Verifica indipendente in corso

I benchmark annunciati da Alibaba non sono ancora stati verificati in modo indipendente. Come sempre con gli annunci di prestazioni, è opportuno restare prudenti in attesa dei test della comunità.

Multimodalità nativa: testo, immagini, audio e video

Qwen 3.5 è il primo modello della famiglia Qwen a offrire una multimodalità nativa. A differenza dei modelli che trattano separatamente testo e immagini, Qwen 3.5 integra nativamente:

Testo — Comprensione e generazione in 201 lingue e dialetti
Immagini — Analisi di immagini fino a 1344x1344 pixel di risoluzione
Audio — Elaborazione dell'audio nativamente integrata
Video — Analisi di clip video fino a 2 ore

Questa capacità multimodale, combinata con una finestra di contesto di 256.000 token (1 milione per la versione ospitata Qwen 3.5-Plus), ne fa uno strumento potente per i casi d'uso aziendali che mescolano diversi tipi di contenuto.

Qwen3-Coder-Next: l'asso del codice

Parallelamente a Qwen 3.5, Alibaba ha lanciato Qwen3-Coder-Next — un modello specializzato nel codice che fa girare la testa alla comunità degli sviluppatori. Con 80 miliardi di parametri (3B attivati per token), raggiunge prestazioni comparabili a modelli 10-20 volte più grandi:

Benchmark	Punteggio	Comparabile a
SWE-Bench Verified	74,2%	Claude Sonnet 4.5
Aider (assistente codice)	69,9%	Top tier
SWE-Bench Multilingual	63,7%	—
SWE-Bench Pro	44,3%	—
Terminal-Bench 2.0	39,3%	—

La cosa più impressionante? Qwen3-Coder-Next gira su hardware consumer: un MacBook con 64 GB di RAM, una RTX 5090 o una AMD Radeon 7900 XTX sono sufficienti. È un argomento decisivo per gli sviluppatori che vogliono un copilota di codice locale, senza dipendere dal cloud.

IA agentica: Qwen 3.5 progettato per gli agenti

Qwen 3.5 non è solo un modello conversazionale. È stato specificamente progettato per l'IA agentica — la capacità di eseguire compiti in modo autonomo su applicazioni mobile e desktop con comprensione visiva.

Il modello integra nativamente:

Chiamate di strumenti strutturate — Invocazione di funzioni e orchestrazione nativa
Navigazione visiva — Comprensione dell'interfaccia per interagire con le applicazioni
Workflow autonomi — Concatenazione di compiti senza intervento umano
Recupero in caso di errore — Adattamento quando un piano non funziona

È un posizionamento strategico: mentre ChatGPT e Claude aggiungono capacità agentiche sopra i loro modelli conversazionali, Qwen 3.5 è stato progettato fin dall'inizio per questi usi.

Prezzi e disponibilità

Due versioni di Qwen 3.5 sono disponibili:

Versione	Parametri	Contesto	Prezzo	Licenza
Qwen 3.5 (open-weight)	397B (17B attivi)	256K token	Gratuito (self-hosted)	Apache 2.0
Qwen 3.5-Plus (ospitato)	397B+ (ottimizzato)	1M token	~0,18$/M token	API Alibaba Cloud

I modelli sono disponibili su [Ollama](/en/companies/ollama), [LM Studio](/en/companies/lm-studio-inc), Together AI, OpenRouter e [Hugging Face](https://huggingface.co). La versione ospitata è accessibile tramite Alibaba Cloud Model Studio.

A titolo di confronto, il pricing di 0,18$ per milione di token è 30-50 volte meno caro rispetto alle tariffe di GPT-4 o Claude Opus per prestazioni annunciate comparabili. Se i benchmark si confermano, è uno sconvolgimento tariffario importante.

Qwen nella corsa mondiale all'IA

L'ascesa di Qwen è fulminea. A dicembre 2025, Qwen ha superato tutti gli altri modelli open source combinati in numero di download su Hugging Face. A gennaio 2026, Qwen-3 è diventato il primo modello IA operato in orbita. Con Qwen 3.5, Alibaba afferma la sua posizione di leader dell'IA open source mondiale.

Per gli utenti europei, Qwen rappresenta un'alternativa interessante ai modelli americani — anche se le questioni di sovranità dei dati rispetto alla Cina restano un tema di vigilanza, così come lo sono con i modelli americani.

Conclusione

Qwen 3.5 è un segnale forte inviato da Alibaba al resto del mondo: l'IA open source cinese non ha più nulla da invidiare ai modelli chiusi occidentali. Con prestazioni annunciate al livello di GPT-5.2 e Claude Opus 4.5, un'efficienza di memoria rivoluzionaria e un prezzo 30-50 volte inferiore, Qwen 3.5 potrebbe costringere gli attori consolidati a rivedere la loro strategia tariffaria.

Per le aziende e gli sviluppatori, è un'ottima notizia: più concorrenza significa strumenti migliori e prezzi più bassi. Il mercato dell'IA non è mai stato così dinamico.

FAQ

Confronta i modelli IA

ChatGPT, Claude, Gemini, Mistral, Qwen... trovate il modello che fa per voi.

Accedi al comparatore

Fonti e riferimenti

Siti ufficiali e risorse :

Claude — claude.ai
Qwen — qwen.ai
anthropic — anthropic.com
openai — openai.com
AMD — amd.com
ChatGPT — chat.openai.com
Hugging Face — huggingface.co
ollama — ollama.com

Consulta le nostre schede dettagliate :

Qwen 3.5 di Alibaba: Il Modello IA che Sfida GPT-5 e Claude Opus con il 95% di Memoria in Meno

Qwen 3.5 di Alibaba: Il Modello IA che Sfida GPT-5 e Claude Opus con il 95% di Memoria in Meno

L'architettura MoE: il segreto di Qwen 3.5

Benchmark: Qwen 3.5 contro i giganti

Multimodalità nativa: testo, immagini, audio e video

Qwen3-Coder-Next: l'asso del codice

IA agentica: Qwen 3.5 progettato per gli agenti

Prezzi e disponibilità

Qwen nella corsa mondiale all'IA

Conclusione

FAQ

Confronta i modelli IA

Fonti e riferimenti

I modelli IA da confrontare

Articoli correlati

Come Usare l'IA con un Budget Ridotto: Guida agli Strumenti Gratuiti e Accessibili

OpenAI Raccoglie 110 Miliardi di Dollari: Record Storico, Perdite Enormi e la Strada Verso Mille Miliardi

I Pericoli di OpenClaw: L'Agente IA Piu Potente e Anche il Piu Rischioso

Pronto a scoprire i migliori strumenti IA?

Rimanga informato sulle ultime notizie sull'IA

Qwen 3.5 di Alibaba: Il Modello IA che Sfida GPT-5 e Claude Opus con il 95% di Memoria in Meno

Qwen 3.5 di Alibaba: Il Modello IA che Sfida GPT-5 e Claude Opus con il 95% di Memoria in Meno

L'architettura MoE: il segreto di Qwen 3.5

Benchmark: Qwen 3.5 contro i giganti

Multimodalità nativa: testo, immagini, audio e video

Qwen3-Coder-Next: l'asso del codice

IA agentica: Qwen 3.5 progettato per gli agenti

Prezzi e disponibilità

Qwen nella corsa mondiale all'IA

Conclusione

FAQ

Qwen 3.5 è gratuito?

Qwen 3.5 è davvero migliore di GPT-5 e Claude?

Si può far girare Qwen 3.5 in locale?

Qwen 3.5 supporta l'italiano?

Qual è la differenza tra Qwen 3.5 e Qwen3-Coder-Next?

Confronta i modelli IA

Fonti e riferimenti

I modelli IA da confrontare

Articoli correlati

Come Usare l'IA con un Budget Ridotto: Guida agli Strumenti Gratuiti e Accessibili

OpenAI Raccoglie 110 Miliardi di Dollari: Record Storico, Perdite Enormi e la Strada Verso Mille Miliardi

I Pericoli di OpenClaw: L'Agente IA Piu Potente e Anche il Piu Rischioso

Pronto a scoprire i migliori strumenti IA?

Rimanga informato sulle ultime notizie sull'IA