Künstliche Intelligenz

DeepSeek V4 Preview ist live: was die offiziellen Docs sagen

|
19. Januar 2026
|
11 Min. Lesezeit
DeepSeek V4 Preview Guide mit Release, Preisen, API und Modelldetails

Get weekly AI tool reviews

We test tools so you don't have to. No spam.

Kurzfassung: geprüft am 10. Mai 2026: DeepSeek V4 ist live. Die offiziellen Docs sagen, dass DeepSeek-V4 Preview am 24. April 2026 mit zwei Modellen gestartet ist: V4 Pro und V4 Flash. Beide unterstützen 1M Kontext, beide sind über die API verfügbar, und DeepSeek verlinkt offene Gewichte aus der Release Note. Der heikle Teil ist der Preis: V4 Pro hat nur bis zum 31. Mai 2026 einen temporären Rabatt von 75%.

Offizielle Fakten zu DeepSeek V4
Updated 10. Mai 2026
  • DeepSeek-V4 Preview ging laut DeepSeek API Docs am 24. April 2026 live
  • Die zwei API-Modelle heißen deepseek-v4-pro und deepseek-v4-flash
  • DeepSeek-V4-Pro ist mit 1.6T Gesamtparametern und 49B aktiven Parametern gelistet
  • DeepSeek-V4-Flash ist mit 284B Gesamtparametern und 13B aktiven Parametern gelistet
  • Beide V4-Modelle unterstützen 1M Kontext sowie Thinking- und Non-Thinking-Modus
  • DeepSeek listet OpenAI-formatierte und Anthropic-formatierte API-Endpunkte
  • DeepSeek verlinkt technischen Bericht und offene Gewichte aus der offiziellen Release Note
  • DeepSeek sagt, dass deepseek-chat und deepseek-reasoner nach dem 24. Juli 2026 um 15:59 UTC auslaufen

Dieser Artikel war früher ein Release-Tracker. Das passt nicht mehr.

DeepSeek hat inzwischen eine offizielle V4 Preview Release Note, eine API-Preisseite, Modellnamen, Kontextlimits, Endpoint-Details, einen technischen Bericht und offene Gewichte veröffentlicht. Die sinnvolle Frage ist nicht mehr: "Wann startet V4?" Die Frage ist: Was wurde wirklich ausgeliefert, was kostet es, und was müssen Entwickler ändern?

Diese Version nutzt DeepSeek-eigene Quellen und offiziell verlinkte Dokumente. Keine Gerüchte. Keine fremden Benchmark-Roundups. Kein Raten.

offizielles V4 Preview Datum
24. Apr
V4 API-Modelle
2
Kontextlänge
1M
maximaler Output laut Docs
384K

Kurze Antwort

Das ist die praktische Entscheidungsregel.

Teste zuerst deepseek-v4-flash, wenn du günstige API-Calls, 1M Kontext und ein Produktionsmodell brauchst, das Thinking und Non-Thinking kann. Nutze deepseek-v4-pro, wenn die Aufgabe stärkeres Reasoning, schwierigeres Coding oder besseres Weltwissen braucht. Schreibe aber das Datum neben jede Kostenrechnung, weil der aktuelle V4-Pro-Rabatt am 31. Mai 2026 um 15:59 UTC endet.

DeepSeek V4 Schnellwahl

BedarfNutzeWarum
Niedrigste API-Kostendeepseek-v4-flashDeepSeek listet niedrigere Cache-Miss-Input- und Output-Preise als bei V4 Pro
Schwierigeres Reasoning oder agentisches Codingdeepseek-v4-proDeepSeek beschreibt es als V4-Flaggschiff
Legacy-KompatibilitätWeg von deepseek-chat / deepseek-reasoner migrierenDeepSeek sagt, dass beide Namen nach dem 24. Juli 2026 auslaufen
Experimente mit offenen GewichtenV4 Flash oder V4 Pro GewichteDeepSeek verlinkt die V4-Gewichte aus der offiziellen Release Note

Source: DeepSeek Release, Preisseite und Changelog

Quellenhinweis

Die Hauptquellen sind DeepSeeks V4 Preview Release, die Models & Pricing Seite und der Change Log. Preise können sich ändern. DeepSeek empfiehlt selbst, die Preisseite regelmäßig zu prüfen.

Offizieller Stand: DeepSeek V4 Preview ist live

Die alte Februar-Diskussion ist erledigt.

DeepSeeks Release Note sagt, dass DeepSeek-V4 Preview seit dem 24. April 2026 live ist. Sie sagt auch, dass das Modell open-sourced ist, mit technischem Bericht und offenen Gewichten direkt aus demselben offiziellen Post.

Was sich seit dem alten Artikel geändert hat

Alte EinordnungAktueller offizieller Stand
Erwarteter Release Mitte Februar 2026Offizielles V4 Preview am 24. April 2026 veröffentlicht
1M Kontext als Gerücht1M Kontext steht in Release Note und Preisseite
Erwartete PreisePreise stehen in den DeepSeek API Docs
Erwarteter Open-Source-ReleaseDeepSeek sagt, V4 Preview ist open-sourced und verlinkt Gewichte
Spekulierte API-DetailsDeepSeek listet Modellnamen, Base URLs, Modi und Features

Offizielle Quellen:

DeepSeek V4 Pro vs DeepSeek V4 Flash

Gleiche Generation, andere Aufgaben.

DeepSeek teilt V4 in zwei Modelle. V4 Pro ist das größere Modell. V4 Flash ist die günstigere und schnellere Variante.

DeepSeek V4 Modelldetails

ModellOffizielle BeschreibungParameterBester Einsatz
DeepSeek-V4-ProFlaggschiffmodell für Reasoning, Weltwissen und agentisches Coding1.6T gesamt / 49B aktivSchweres Coding, Recherche, Long-Context-Arbeit
DeepSeek-V4-FlashKleineres, schnelleres und wirtschaftlicheres V4-Modell284B gesamt / 13B aktivHoher Durchsatz, einfache Agentenaufgaben, kostenbewusstes Routing

Source: DeepSeek V4 Preview Release

Brauchen Sie Hilfe bei der Umsetzung?

Über 50 Umsetzungen · 60 % schneller · 2–4 Wochen

DeepSeek sagt, dass V4 Flash beim Reasoning nahe an V4 Pro herankommt und bei einfachen Agentenaufgaben gleichauf liegt. Ich würde trotzdem beide mit dem eigenen Workload testen. "Einfache Agentenaufgabe" ist breit und wird in der Release Note nicht eng definiert.

API-Zugang und Migration

Base URL behalten, Modellnamen ändern.

DeepSeek sagt, dass die API jetzt verfügbar ist. Die Migration ist simpel: gleiche Base URL behalten und das Modell auf deepseek-v4-pro oder deepseek-v4-flash setzen.

DeepSeek V4 API-Details

PunktOffizieller Wert
OpenAI-Format Base URLhttps://api.deepseek.com
Anthropic-Format Base URLhttps://api.deepseek.com/anthropic
Modellnamendeepseek-v4-flash, deepseek-v4-pro
Thinking-ModiThinking und Non-Thinking unterstützt
Kontextlänge1M
Maximaler Output384K
JSON OutputUnterstützt
Tool CallsUnterstützt
FIM CompletionNur im Non-Thinking-Modus

Source: DeepSeek Models & Pricing

Alte DeepSeek-Modellnamen laufen aus

DeepSeek sagt, dass deepseek-chat und deepseek-reasoner derzeit auf DeepSeek V4 Flash routen. Die offizielle V4 Release Note sagt, dass diese Namen nach dem 24. Juli 2026 um 15:59 UTC auslaufen.

Wenn deine App noch deepseek-chat oder deepseek-reasoner nutzt, warte nicht bis zur Frist. Migriere auf die V4-Namen und teste Output-Länge, Tool Calls, JSON-Verhalten, Latenz und Kosten, bevor Produktionsverkehr daran hängt.

DeepSeek V4 Preise

Der Rabatt zählt, also datiere deine Zahlen.

DeepSeek listet Preise pro 1M Tokens. Am 10. Mai 2026 hat V4 Flash den normalen Listenpreis, während V4 Pro mit einem temporären Rabatt von 75% angezeigt wird. DeepSeek sagt, dass dieser Rabatt bis zum 31. Mai 2026 um 15:59 UTC läuft.

DeepSeek V4 API-Preise am 10. Mai 2026

ModellCache-Hit InputCache-Miss InputOutput
DeepSeek V4 Flash$0.0028$0.14$0.28
DeepSeek V4 Pro$0.003625 rabattiert von $0.0145$0.435 rabattiert von $1.74$0.87 rabattiert von $3.48

Source: DeepSeek Models & Pricing

Der Cache-Hit-Preis ist leicht zu übersehen. DeepSeek sagt, dass er ab dem 26. April 2026 um 12:15 UTC auf ein Zehntel des Startpreises gesenkt wurde. Wenn dein Workload lange System-Prompts oder geteilten Kontext wiederverwendet, ändert das die Rechnung deutlich.

Für Kaufentscheidungen aktuelle Preise prüfen

Die V4-Pro-Preise oben enthalten einen temporären Rabatt. Wenn du das nach dem 31. Mai 2026 liest, prüfe DeepSeeks Preisseite, bevor du Kosten vergleichst.

Benchmarks und Performance-Claims

Was DeepSeek sagt, und was wir nicht behaupten.

DeepSeeks Release Note macht starke Aussagen zur Leistung, aber die Textversion der offiziellen Seite zeigt nicht alle Benchmark-Tabellen sauber. Deshalb bleibt dieser Guide bewusst vorsichtig.

Offizielle Performance-Claims in der Release Note

BereichDeepSeeks offizieller Claim
Agentisches CodingV4 Pro wird als Open-Source-SOTA in agentischen Coding-Benchmarks beschrieben
WeltwissenV4 Pro wird als führend unter aktuellen offenen Modellen beschrieben, nur hinter Gemini 3.1 Pro
ReasoningV4 Pro soll aktuelle offene Modelle in Math, STEM und Coding schlagen
V4 FlashDeepSeek sagt, V4 Flash kommt beim Reasoning nahe an V4 Pro heran
Einfache AgentenaufgabenDeepSeek sagt, V4 Flash liegt bei einfachen Agentenaufgaben gleichauf mit V4 Pro

Source: DeepSeek V4 Preview Release

Das sind offizielle DeepSeek-Claims. Sie sind hilfreich, bleiben aber Anbieter-Claims. Ich füge hier keine Drittanbieterzahlen hinzu, weil diese Aktualisierung nur auf offiziellen Quellen beruht.

Architektur-Notizen

Was DeepSeek im V4-Release direkt nennt.

Der alte Artikel sprach viel über Engram und mHC. Das können interessante DeepSeek-Forschungslinien sein, aber die offizielle V4 Preview Release Note nennt andere Punkte ausdrücklich.

Architektur und Fähigkeiten laut DeepSeek

PunktWas DeepSeek sagt
DeepSeek Sparse AttentionV4 nutzt tokenweise Kompression plus DSA
Langer Kontext1M Kontext ist in offiziellen DeepSeek-Services als Standard gelistet
Agenten-IntegrationenDeepSeek sagt, V4 ist mit Agenten wie Claude Code, OpenClaw und OpenCode integriert
API-KompatibilitätOpenAI ChatCompletions und Anthropic APIs werden unterstützt
ModiBeide V4-Modelle unterstützen Thinking und Non-Thinking

Source: DeepSeek V4 Preview Release

Die saubere Kurzbeschreibung: DeepSeek setzt mit V4 auf langen Kontext, günstige Inferenz und Agenten-Workflows. Für technische Details lohnt der offizielle technische Bericht aus der Release Note.

Migrations-Checkliste

Was vor Produktionsverkehr getestet werden sollte.

DeepSeek V4 Migration

  1. 1deepseek-chat oder deepseek-reasoner durch deepseek-v4-flash oder deepseek-v4-pro ersetzen
  2. 2Base URL behalten, außer du wechselst zwischen OpenAI-Format und Anthropic-Format
  3. 3Für jeden Call entscheiden, ob Thinking oder Non-Thinking nötig ist
  4. 4JSON Output, Tool Calls und FIM Completion testen, falls deine App darauf angewiesen ist
  5. 5Output-Annahmen prüfen, weil DeepSeek 384K maximalen Output listet
  6. 6Kosten getrennt nach Cache-Hit und Cache-Miss berechnen
  7. 7Jede V4-Pro-Kostenrechnung datieren, weil der Rabatt temporär ist

Für die meisten Apps ist V4 Flash der erste Test. Es ist viel günstiger, die alten Kompatibilitätsnamen routen dorthin, und DeepSeek positioniert es für wirtschaftlichen Produktionseinsatz. V4 Pro lohnt sich, wenn die Aufgabe das größere Modell wirklich rechtfertigt.

Kurz gesagt

Fazit

DeepSeek V4 ist jetzt real. Sorgfalt braucht es bei Preisen und Migration.

Die alte Version dieses Artikels drehte sich um eine Frage, die beantwortet ist. DeepSeek V4 Preview ist live. Die offiziellen Docs geben Modellnamen, Kontextlänge, API-Formate, Features, Preise, offene Gewichte und eine Frist für alte Kompatibilitätsnamen.

Der wichtigste praktische Punkt ist der Preis. V4 Flash ist beim Output extrem günstig, und V4 Pro ist temporär rabattiert. Alte Kostenvergleiche veralten dadurch schnell. Für Produktion solltest du die aktuelle DeepSeek-Preisseite nutzen, nicht eine kopierte Zahl aus einem alten Post.

Meine praktische Einschätzung: V4 Flash als Standardkandidat für kostenbewusste Agenten- und Long-Context-Arbeit testen. V4 Pro nur dort testen, wo die Aufgabe es wirklich braucht. Wenn du noch deepseek-chat oder deepseek-reasoner nutzt, migriere vor dem 24. Juli 2026.

Für die breitere Modellwahl gibt es unsere Claude Opus 4.7 vs GPT-5.2 vs Gemini 3.1 Pro vs DeepSeek V4 Analyse. Wenn vor allem der Preis zählt, rechne deinen Use Case im KI-Kostenrechner durch.

Brauchst du Hilfe bei der Modellwahl?

Nutze unseren kostenlosen AI Model Picker, um Modelle nach Use Case, Budget und Workflow zu vergleichen.

AI Model Picker öffnen