di Karen Kharmandarian e Alexandre Zilliox
Thematics AM, affiliata di Natixis IM
Cosa è succeso
Il mercato ha reagito in modo molto negativo dopo l’annuncio di un nuovo modello di AI (DeepSeek, ndr) che, secondo quanto riferito, è costato solo 6 milioni di dollari per l’addestramento, utilizzando chip vecchi di due generazioni, con costi di inferenza previsti oltre dieci volte inferiori a quelli dei modelli di OpenAI.
Motivi della reazione
Questa reazione deriva dalle preoccupazioni del mercato riguardo alla futura domanda di potenza di calcolo. Se è effettivamente possibile creare modelli efficaci come quelli più noti (come Llama di Meta o GPT di OpenAI) utilizzando hardware meno avanzato e costi operativi significativamente inferiori, ci si interroga sulla necessità di acceleratori di IA ad alte prestazioni. Ciò potrebbe in ultima analisi portare a una riduzione della domanda di apparecchiature di produzione, che si è riflessa nei cali di ASM e ASML.
View attuale
La reazione del mercato è comprensibile nel contesto di valutazioni elevate, soprattutto in vista della pubblicazione dei risultati trimestrali. Si registrano crescenti incertezze in merito alla capacità e ai tempi necessari ai principali operatori tecnologici per recuperare gli ingenti investimenti effettuati. Stiamo rivalutando le nostre posizioni caso per caso, ma in generale consideriamo questa situazione come un’opportunità per rafforzare le partecipazioni che sono fondamentalmente meno colpite.
Sei temi per i prossimi mesi
‒ Stime dei costi... ci sono pochissime informazioni concrete sui costi di formazione del modello di DeepSeek. Alcuni operatori di mercato suggeriscono che l’azienda potrebbe disporre di un cluster di 50.000 GPU Nvidia H100, il che farebbe lievitare l’investimento a miliardi di dollari. Senza considerare gli stipendi degli ingegneri che lavorano al progetto, la cifra di 6 milioni di dollari sembra molto discutibile;
‒ Tipi di modelli… la maggior parte dei modelli di DeepSeek sono “distillati” (un metodo di trasferimento della conoscenza da un modello di grandi dimensioni a un modello più piccolo), il che implica che il modello originale ha probabilmente richiesto risorse computazionali significativamente maggiori per l’addestramento. La trasparenza sulle operazioni dell’azienda rimane limitata;
‒ Vantaggi dell’architettura aperta… dato che DeepSeek opera con un modello di architettura aperta, i miglioramenti architettonici apportati dall’azienda vanno a beneficio dell’intero ecosistema, consentendo un’analisi più ampia dei progressi che questi modelli forniscono. Ciò potrebbe in ultima analisi essere vantaggioso per gli operatori del software, facilitando l’adozione della tecnologia;
‒ Domanda di chip… Se si considerano queste affermazioni, è possibile che si riduca la domanda di potenza di calcolo e, di conseguenza, di chip. Tuttavia, il paradosso di Jevons suggerisce che, con l’aumento dell’efficienza dei modelli, potrebbe aumentare anche il consumo complessivo. In altre parole, questi progressi potrebbero promuovere l’adozione attraverso mezzi economici, riducendo i costi di formazione e di inferenza. Pertanto, non siamo convinti che la domanda di chip crollerà; al contrario, potrebbe rimanere sana;
‒ Valutazione del rischio… storicamente abbiamo considerato i fornitori di modelli fondamentali come i più a rischio all’interno della catena del valore, con la convinzione che alcuni modelli potrebbero diventare rapidamente delle “commodity”. Di conseguenza, il nostro portafoglio è esposto in misura minima a questo settore;
‒ Ulteriori considerazioni… I fattori geopolitici non vanno trascurati con questi annunci. Le entità cinesi potrebbero cercare di spostare l’equilibrio di potere dimostrando che le restrizioni alle esportazioni hanno un impatto limitato sulla loro capacità di competere con gli Stati Uniti nel campo dell’IA, in particolare offrendo il modello come open source (un sistema collaborativo/decentrato) mentre la maggior parte dei modelli americani rimane closed source (un sistema proprietario e monetizzato)
In sintesi, sebbene la reazione del mercato sia radicata in preoccupazioni valide sul futuro delle esigenze computazionali e dei ritorni degli investimenti, le implicazioni complete di questi sviluppi richiederanno un monitoraggio attento e una comprensione sfumata.
***** l’articolo pubblicato è ritenuto affidabile e di qualità*****
Visita il sito e gli articoli pubblicati cliccando sul seguente link