Recherche · Satellite

L'Économie des Tokens DeepSeek à 0,27 $ — Ce qu'un Écart de Prix ×20 Signifie pour le Supercycle Mémoire

Si les tokens output frontier-quality coûtent 1,10 $/M depuis un modèle open-weight chinois et 25-30 $/M depuis le frontier US, l'inflection du cycle mémoire est Q1 2027, pas 2028.

Publié le 22 mai 2026 · CrossVol Research

Papier compagnon de notre recherche pilier La Thèse de Disruption IA Chine. Ce papier zoom sur le Vecteur 1 et le connecte au cycle mémoire pour montrer pourquoi l'inflection est matériellement plus tôt que ce que le consensus price.

Le Tableau de Prix Qui Ré-évalue la Stack IA

Modèle	Input ($/M tokens)	Output ($/M tokens)	Multiple Output
DeepSeek V4 Pro	0,27 $	1,10 $	1,0× (baseline)
DeepSeek V4 Flash	0,14 $	0,28 $	0,25×
Qwen 3.5 Max (Alibaba)	0,40 $	1,20 $	1,1×
Gemini 2.5 Pro	3,50 $	10,50 $	9,5×
Claude Sonnet 4.6	3,00 $	15,00 $	13,6×
Claude Opus 4.7	5,00 $	25,00 $	22,7×
GPT-5.5	~5,00 $	30,00 $	27,3×

Sur les tokens output — là où la marge est concentrée et où réside l'essentiel des dépenses enterprise — le multiple entre DeepSeek V4 Pro et frontier US se situe entre 14× (Claude Sonnet) et 27× (GPT-5.5). Le modèle US production mid-tier (Gemini 2.5 Pro) est à 9,5× le prix pour intelligence benchmark-équivalente.

Est-ce une Subvention ? Trois Tests Indépendants

La rebuttal sell-side naturelle est : DeepSeek vend tokens sous coût, le gouvernement chinois subventionne, le spread se normalisera. Nous avons fait tourner trois tests indépendants et concluons que le pricing reflète un avantage coût structurel, pas une subvention.

Test 1 : L'Architecture Est-Elle Moins Chère ?

DeepSeek V4 est un modèle mixture-of-experts (MoE) avec ~37 Md de paramètres actifs par appel d'inférence contre 671 Md de paramètres totaux. Le compute par token implicite est matériellement plus bas que les modèles frontier US dense. Coûts d'entraînement publiés à 5-8 M$ contre 50-500 M$ pour US frontier. Même en discountant le chiffre publié, le gap d'efficience architecturale est réel. Le compute inference active-parameter est 10-20× moins cher que dense-frontier.

Test 2 : Les Vendeurs Chinois Concurrents Pricent-Ils de Façon Cohérente ?

Si DeepSeek faisait du loss-leader, on s'attendrait à ce qu'Alibaba (Qwen), Tencent (Hunyuan), Baidu (Ernie), ByteDance (Doubao) pricent soit beaucoup plus haut (attendre l'épuisement) soit beaucoup plus bas (chasser la part). Au lieu de cela, les cinq vendors chinois majeurs sont dans une fourchette de pricing 30% les uns des autres sur des tiers d'intelligence équivalents. C'est un équilibre concurrentiel, pas une subvention single-actor.

Test 3 : L'Inférence se Déploie-t-elle Économiquement sur Hardware Chinois ?

L'architecture Huawei Ascend 910C et Atlas 800 supporte l'inférence DeepSeek V4 à un coût par token cohérent avec le pricing API plus marge raisonnable. La thèse "subvention" requerrait Huawei de vendre Atlas 800 à perte — ce qui contredit les disclosures financières propres de Huawei (RMB 153 Md de net income en 2025).

Les trois tests pointent à la même conclusion : le pricing reflète un avantage coût structurel enraciné dans (a) efficience architecturale, (b) inputs électricité prix-chinois, (c) silicium d'inférence Huawei à coût hardware matériellement plus bas que NVIDIA-equivalents. Le gap ne se ferme pas sur un timeline d'épuisement de subvention.

L'Analogue S3 — 80% Compression sur Six Ans

L'analogue historique que nous tirons est le pricing storage AWS S3 (2007-2013). Le produit a launchéà ~0,15 $ par GB-mois. En 2013 il était tombé à 0,03 $ par GB-mois — une compression 80% sur six ans. Le mécanisme était la concurrence commodity (Google Cloud, Azure, Backblaze) arrivant à la même frontière de coût opérationnel et forçant le prix.

L'inférence IA suit la même courbe mais compressée sur 18-24 mois. Un token output frontier-quality coûtait ~30 $/M mi-2023 (lancement GPT-4) et est maintenant disponible à 1,10 $/M depuis DeepSeek V4 Pro. C'est une compression 96% sur 30 mois.

Comment Cela Ré-évalue le Supercycle Mémoire

Morgan Stanley a remonté son PT Micron à 250 $ en mai 2026 citant un "supercycle mémoire similaire à 2017" avec "tension HBM structurelle jusqu'à 2027". BofA projette le revenu DRAM +51% YoY 2026 et le marché HBM à 54,6 Md$. Les deux frameworks supposent :

La demande compute IA est une fonction one-way du scaling modèles.
CXMT (DRAM chinois) reste un player ~5% global tout au long du cycle.
Le capex hyperscaler soutient la croissance demande mémoire jusqu'en 2028.

Les données token-economics réfutent l'hypothèse (1). Si les prix tokens output se compressent 5-10× sur 18 mois, le revenu IA par dollar requiert une croissance volume 5-10× juste pour tenir le revenu plat. La justification capex bascule de "il nous faut plus de GPUs car le revenu par workload est élevé" à "il nous faut plus de GPUs car le volume scale mais la marge se compresse" — une psychologie d'engagement capex fondamentalement différente.

Les données CXMT réfutent l'hypothèse (2). CXMT a :

Shifté 60 000 wafers/mois (20% capacité) à production HBM-only.
Démontré capacité production DDR5-8000 et LPDDR5X-10667.
Annoncé first-mover LPDDR6 pour H2 2026, devant Samsung et Micron.
Refilé pour cotation STAR Market avec ~5 Md$ war chest pour deux fabs additionnels.

Si CXMT atteint 8-10% de part DRAM globale d'ici fin 2026 (que les ajouts capacité supportent), l'inflection cycle mémoire bouge de 2028 (consensus sell-side) à Q1 2027 (notre cas central).

L'Implication Micron-Spécifique

Cas	Outcome Q1 2027	Mouvement MU Implicite
Bull MS	HBM tight jusqu'à 2027, MU FY27 EPS 25 $+, expansion multiple	+30-45% du spot
Notre Base	Inflection mémoire Q1 2027, CXMT à 8-10%, FY27 EPS 14-17 $, compression multiple	−25-35% du spot
Bear Tail	Token economics forcent pause capex hyperscaler, MU FY27 EPS 9-12 $	−45-55% du spot

La surface options listée MU price approximativement un range implicite ±15-20% un an. Notre cas central est en dehors de ce range au downside. Notre bear tail est matériellement en dehors. C'est l'asymétrie que la structure dispersion capture via long vega single-name. Voir Trading de Dispersion sur la Thèse IA Chine pour la construction.

Conclusion

DeepSeek V4 Pro à 1,10 $/M tokens output n'est pas une subvention. C'est la nouvelle frontière coût structurelle d'inférence IA frontier-quality, validée par équilibre concurrentiel avec quatre autres vendors chinois majeurs et par l'économie hardware Huawei Ascend. Le multiple 20× sur outputs entre open-weight chinois et frontier US ne se ferme pas sur un timeline d'épuisement subvention — il s'élargit sur la courbe efficience-architecturale.

Pour la thèse mémoire supercycle, cela se traduit directement : la compression revenu par token réécrit l'équation capex hyperscaler d'une façon qui pull forward l'inflection cycle de 2028 à Q1 2027. Le framework Morgan Stanley / BofA est directionnellement correct pour H1 2026 et structurellement faux pour H2 2026 onward.

Pour la thèse complète : La Thèse de Disruption IA Chine. Pour le mécanisme transmission architecture financière : Le Mur d'Obligations des Hyperscalers. Pour la contrainte infrastructure physique : PJM à 329 $/MW-jour.

Avertissement : Ce document est fourni à titre d'information uniquement. Communication promotionnelle non-MIFID dans l'Union européenne.

Le Tableau de Prix Qui Ré-évalue la Stack IA

Est-ce une Subvention ? Trois Tests Indépendants

Test 1 : L'Architecture Est-Elle Moins Chère ?

Test 2 : Les Vendeurs Chinois Concurrents Pricent-Ils de Façon Cohérente ?

Test 3 : L'Inférence se Déploie-t-elle Économiquement sur Hardware Chinois ?

L'Analogue S3 — 80% Compression sur Six Ans

Comment Cela Ré-évalue le Supercycle Mémoire

L'Implication Micron-Spécifique

Conclusion

The China AI Disruption Thesis

CrossVol Research on Substack

Live on Bluesky

Live on X

Avant de partir...

Passez de lecteur à trader.