european-ai-watch.eu

Als DeepSeek Anfang 2025 sein erstes großes Modell veröffentlichte, verlor die amerikanische Techbörse innerhalb weniger Stunden hunderte Milliarden Dollar an Börsenwert. Nicht weil DeepSeek besser war als OpenAI oder Anthropic. Sondern weil plötzlich eine unangenehme Frage im Raum stand:

Braucht man für KI wirklich gigantische Rechenzentren im Gigawatt-Maßstab?

Genau diese Frage stellt DeepSeek jetzt erneut – mit V4.

Die neue Modellgeneration aus China tritt offen gegen die amerikanischen Frontier-Modelle von OpenAI, Anthropic und Google an. Und erstmals wirkt es nicht mehr wie ein Experiment aus der zweiten Reihe. DeepSeek V4 spielt in vielen Benchmarks inzwischen tatsächlich in derselben Liga.  

Besonders bemerkenswert ist dabei nicht nur die Leistung, sondern die Richtung, in die sich die Architektur bewegt. Während Sam Altman jahrelang argumentierte, dass Modelle immer größer werden müssten und der Weg zwangsläufig über riesige Datencenter führe, verfolgt DeepSeek einen anderen Ansatz: sparsamer rechnen, aktiver nur kleine Teile des Modells nutzen und Kontext effizienter verwalten.

DeepSeek V4 Pro soll insgesamt rund 1,6 Billionen Parameter besitzen, gleichzeitig aber nur etwa 49 Milliarden Parameter aktiv verwenden. Die kleinere Flash-Version arbeitet mit 284 Milliarden Parametern und lediglich 13 Milliarden aktiven Parametern.  

Genau darin liegt der eigentliche Sprengstoff.

Denn viele Anleger gingen bisher davon aus, dass die großen Gewinner des KI-Zeitalters vor allem Betreiber gigantischer GPU-Farmen sein würden. DeepSeek stellt dieses Narrativ infrage. Nicht weil das Modell keine enorme Hardware benötigt – das tut es durchaus –, sondern weil die Effizienzkurve plötzlich wichtiger wird als rohe Skalierung.

Laut verschiedenen technischen Analysen lässt sich eine quantisierte Version von DeepSeek V4 bereits auf vergleichsweise kleinen GPU-Setups betreiben. Genannt werden etwa vier H100-GPUs oder sogar einzelne RTX-5090-Konfigurationen für kleinere Varianten.  

Noch vor zwei Jahren hätte man solche Aussagen bei einem Frontier-Modell für absurd gehalten.

Hinzu kommt die geopolitische Dimension. DeepSeek V4 wurde offenbar gezielt für Huaweis Ascend-Beschleuniger optimiert und nicht primär für Nvidia-Hardware. Reuters spricht von einem klaren Schritt Chinas in Richtung technologische Eigenständigkeit.  

Das erklärt auch die Nervosität in den USA. Denn wenn leistungsfähige Modelle plötzlich nicht mehr exklusiv auf amerikanischen Chips und amerikanischer Infrastruktur laufen, verschiebt sich das Machtgefüge der gesamten Branche.

In Benchmarks zeigt DeepSeek V4 mittlerweile starke Ergebnisse bei Coding, Reasoning und Agent-Workflows. Auf einigen öffentlichen Tests liegt das Modell nahe an GPT-5.4 mini oder Claude Opus, auch wenn amerikanische Closed-Source-Modelle bei komplexem Reasoning teilweise noch vorne liegen.  

Interessant ist vor allem die Kostenstruktur. DeepSeek positioniert V4 massiv unter den Preisen westlicher Anbieter. Während OpenAI und Anthropic weiterhin hohe API-Preise verlangen, versucht DeepSeek über aggressive Effizienz und Open-Source-Nähe Marktanteile zu gewinnen.

Die zentrale Implikation von DeepSeek V4 besteht nicht primär in der Proklamation einer neuen globalen Leistungsspitze. Vielmehr fungiert das Modell als Proof-of-Concept für eine neue Ära der Effizienz: Die Botschaft lautet, dass die Skalierung von KI-Fähigkeiten künftig eine deutlich geringere energetische Last und Rechenleistung erfordern könnte, als die bisherige Gigawatt-Explosion der Branche vermuten liess.

Liang Wenfeng, der Kopf hinter dem DeepSeek-Phänomen

Leave a Reply

Your email address will not be published. Required fields are marked *