Alibaba lancia Qwen 2.5 Max: il nuovo modello IA che (forse) supera DeepSeek V3 e ChatGpt 4o

Laboratorio intelligenza artificiale, schermi e persone al lavoro.
AI NEWS
30 Gen 2025
Tempo di lettura: 2 minuti
Indice Contenuti
Tempo di lettura: 2 minuti

Alibaba ha recentemente annunciato il rilascio di Qwen 2.5-Max, una versione avanzata del suo modello di intelligenza artificiale, dichiarando che supera i principali concorrenti, tra cui DeepSeek-V3GPT-4o di OpenAI e Llama-3.1-405B di Meta, in numerosi benchmark. Questo aggiornamento rappresenta una risposta diretta alla rapida ascesa di DeepSeek, una startup cinese che ha guadagnato fama per i suoi modelli IA altamente efficienti e a basso costo [1].

Caratteristiche principali di Qwen 2.5-Max

  1. Architettura avanzata: Qwen 2.5-Max utilizza un modello Mixture-of-Experts (MoE), pre-addestrato su oltre 20 trilioni di token e ulteriormente migliorato attraverso tecniche come il Supervised Fine-Tuning (SFT) e il Reinforcement Learning from Human Feedback (RLHF).
  2. Performance nei benchmark: Secondo Alibaba, Qwen 2.5-Max eccelle in test come:
    • Arena-Hard (preferenze umane),
    • LiveBench (capacità generali),
    • LiveCodeBench (programmazione),
    • GPQA-Diamond (domande complesse).
      Ha ottenuto anche risultati competitivi in test accademici come MMLU-Pro, che valuta conoscenze di livello universitario.
  3. Efficienza e scalabilità: Il modello è progettato per offrire prestazioni elevate con costi operativi inferiori rispetto ai concorrenti, rendendolo adatto a un'ampia gamma di applicazioni.

Confronto con DeepSeek e altri modelli

  • Alibaba afferma che Qwen 2.5-Max supera quasi "su tutta la linea" DeepSeek-V3, GPT-4o e Llama-3.1-405B, dimostrando un netto miglioramento rispetto alle versioni precedenti della serie Qwen.
  • Tuttavia, DeepSeek ha consolidato la sua posizione grazie alla trasparenza sui costi di addestramento e sull'efficienza energetica dei suoi modelli, fattori che hanno attirato l'attenzione della comunità tecnologica globale.
Qwen 2.5 Max vs DeepSeek vs Llama 405B

Strategia e tempistica

Il lancio di Qwen 2.5-Max è avvenuto il primo giorno del Capodanno Lunare cinese, un momento insolito ma strategico per massimizzare l'attenzione mediatica e rispondere alla crescente pressione esercitata da DeepSeek sul mercato domestico e internazionale. Questo riflette la competizione serrata tra i giganti tecnologici cinesi come Alibaba, Tencent e Baidu per dominare il settore dell'IA.

Prospettive future

Alibaba deve ancora pubblicare dettagli completi sui parametri del modello, sui costi di addestramento e sul consumo energetico, aspetti che potrebbero influenzare la percezione della comunità tecnologica riguardo alle sue affermazioni. Nel frattempo, DeepSeek continua a innovare rapidamente, mirando alla creazione di un'IA Generale (Artificial General Intelligence), mantenendo alta la pressione sui concorrenti.In sintesi, mentre Qwen 2.5-Max rappresenta un passo significativo per Alibaba nella corsa all'IA, la mancanza di dati indipendenti sui benchmark potrebbe limitare l'impatto dell'annuncio fino a ulteriori verifiche. La competizione tra Alibaba e DeepSeek promette comunque di definire il futuro dell'intelligenza artificiale in Cina e oltre.

Categorie
Rimaniamo in contatto
Scopri come puoi crescere con noi: compila il form e prenota la tua consulenza gratuita.
Short Contact Form