Kurzfassung: geprüft am 10. Mai 2026: DeepSeek V4 ist live. Die offiziellen Docs sagen, dass DeepSeek-V4 Preview am 24. April 2026 mit zwei Modellen gestartet ist: V4 Pro und V4 Flash. Beide unterstützen 1M Kontext, beide sind über die API verfügbar, und DeepSeek verlinkt offene Gewichte aus der Release Note. Der heikle Teil ist der Preis: V4 Pro hat nur bis zum 31. Mai 2026 einen temporären Rabatt von 75%.
- DeepSeek-V4 Preview ging laut DeepSeek API Docs am 24. April 2026 live
- Die zwei API-Modelle heißen deepseek-v4-pro und deepseek-v4-flash
- DeepSeek-V4-Pro ist mit 1.6T Gesamtparametern und 49B aktiven Parametern gelistet
- DeepSeek-V4-Flash ist mit 284B Gesamtparametern und 13B aktiven Parametern gelistet
- Beide V4-Modelle unterstützen 1M Kontext sowie Thinking- und Non-Thinking-Modus
- DeepSeek listet OpenAI-formatierte und Anthropic-formatierte API-Endpunkte
- DeepSeek verlinkt technischen Bericht und offene Gewichte aus der offiziellen Release Note
- DeepSeek sagt, dass deepseek-chat und deepseek-reasoner nach dem 24. Juli 2026 um 15:59 UTC auslaufen
Dieser Artikel war früher ein Release-Tracker. Das passt nicht mehr.
DeepSeek hat inzwischen eine offizielle V4 Preview Release Note, eine API-Preisseite, Modellnamen, Kontextlimits, Endpoint-Details, einen technischen Bericht und offene Gewichte veröffentlicht. Die sinnvolle Frage ist nicht mehr: "Wann startet V4?" Die Frage ist: Was wurde wirklich ausgeliefert, was kostet es, und was müssen Entwickler ändern?
Diese Version nutzt DeepSeek-eigene Quellen und offiziell verlinkte Dokumente. Keine Gerüchte. Keine fremden Benchmark-Roundups. Kein Raten.
Kurze Antwort
Das ist die praktische Entscheidungsregel.
Teste zuerst deepseek-v4-flash, wenn du günstige API-Calls, 1M Kontext und ein Produktionsmodell brauchst, das Thinking und Non-Thinking kann. Nutze deepseek-v4-pro, wenn die Aufgabe stärkeres Reasoning, schwierigeres Coding oder besseres Weltwissen braucht. Schreibe aber das Datum neben jede Kostenrechnung, weil der aktuelle V4-Pro-Rabatt am 31. Mai 2026 um 15:59 UTC endet.
DeepSeek V4 Schnellwahl
| Bedarf | Nutze | Warum |
|---|---|---|
| Niedrigste API-Kosten | deepseek-v4-flash | DeepSeek listet niedrigere Cache-Miss-Input- und Output-Preise als bei V4 Pro |
| Schwierigeres Reasoning oder agentisches Coding | deepseek-v4-pro | DeepSeek beschreibt es als V4-Flaggschiff |
| Legacy-Kompatibilität | Weg von deepseek-chat / deepseek-reasoner migrieren | DeepSeek sagt, dass beide Namen nach dem 24. Juli 2026 auslaufen |
| Experimente mit offenen Gewichten | V4 Flash oder V4 Pro Gewichte | DeepSeek verlinkt die V4-Gewichte aus der offiziellen Release Note |
Source: DeepSeek Release, Preisseite und Changelog
Quellenhinweis
Die Hauptquellen sind DeepSeeks V4 Preview Release, die Models & Pricing Seite und der Change Log. Preise können sich ändern. DeepSeek empfiehlt selbst, die Preisseite regelmäßig zu prüfen.
Offizieller Stand: DeepSeek V4 Preview ist live
Die alte Februar-Diskussion ist erledigt.
DeepSeeks Release Note sagt, dass DeepSeek-V4 Preview seit dem 24. April 2026 live ist. Sie sagt auch, dass das Modell open-sourced ist, mit technischem Bericht und offenen Gewichten direkt aus demselben offiziellen Post.
Was sich seit dem alten Artikel geändert hat
| Alte Einordnung | Aktueller offizieller Stand |
|---|---|
| Erwarteter Release Mitte Februar 2026 | Offizielles V4 Preview am 24. April 2026 veröffentlicht |
| 1M Kontext als Gerücht | 1M Kontext steht in Release Note und Preisseite |
| Erwartete Preise | Preise stehen in den DeepSeek API Docs |
| Erwarteter Open-Source-Release | DeepSeek sagt, V4 Preview ist open-sourced und verlinkt Gewichte |
| Spekulierte API-Details | DeepSeek listet Modellnamen, Base URLs, Modi und Features |
Offizielle Quellen:
- DeepSeek-V4 Preview Release
- DeepSeek Models & Pricing
- DeepSeek API Change Log
- DeepSeek V4 Gewichte-Sammlung, von DeepSeek verlinkt
- DeepSeek V4 technischer Bericht, von DeepSeek verlinkt
DeepSeek V4 Pro vs DeepSeek V4 Flash
Gleiche Generation, andere Aufgaben.
DeepSeek teilt V4 in zwei Modelle. V4 Pro ist das größere Modell. V4 Flash ist die günstigere und schnellere Variante.
DeepSeek V4 Modelldetails
| Modell | Offizielle Beschreibung | Parameter | Bester Einsatz |
|---|---|---|---|
| DeepSeek-V4-Pro | Flaggschiffmodell für Reasoning, Weltwissen und agentisches Coding | 1.6T gesamt / 49B aktiv | Schweres Coding, Recherche, Long-Context-Arbeit |
| DeepSeek-V4-Flash | Kleineres, schnelleres und wirtschaftlicheres V4-Modell | 284B gesamt / 13B aktiv | Hoher Durchsatz, einfache Agentenaufgaben, kostenbewusstes Routing |
Source: DeepSeek V4 Preview Release
Brauchen Sie Hilfe bei der Umsetzung?
Über 50 Umsetzungen · 60 % schneller · 2–4 Wochen
DeepSeek sagt, dass V4 Flash beim Reasoning nahe an V4 Pro herankommt und bei einfachen Agentenaufgaben gleichauf liegt. Ich würde trotzdem beide mit dem eigenen Workload testen. "Einfache Agentenaufgabe" ist breit und wird in der Release Note nicht eng definiert.
API-Zugang und Migration
Base URL behalten, Modellnamen ändern.
DeepSeek sagt, dass die API jetzt verfügbar ist. Die Migration ist simpel: gleiche Base URL behalten und das Modell auf deepseek-v4-pro oder deepseek-v4-flash setzen.
DeepSeek V4 API-Details
| Punkt | Offizieller Wert |
|---|---|
| OpenAI-Format Base URL | https://api.deepseek.com |
| Anthropic-Format Base URL | https://api.deepseek.com/anthropic |
| Modellnamen | deepseek-v4-flash, deepseek-v4-pro |
| Thinking-Modi | Thinking und Non-Thinking unterstützt |
| Kontextlänge | 1M |
| Maximaler Output | 384K |
| JSON Output | Unterstützt |
| Tool Calls | Unterstützt |
| FIM Completion | Nur im Non-Thinking-Modus |
Source: DeepSeek Models & Pricing
Alte DeepSeek-Modellnamen laufen aus
DeepSeek sagt, dass deepseek-chat und deepseek-reasoner derzeit auf DeepSeek V4 Flash routen. Die offizielle V4 Release Note sagt, dass diese Namen nach dem 24. Juli 2026 um 15:59 UTC auslaufen.
Wenn deine App noch deepseek-chat oder deepseek-reasoner nutzt, warte nicht bis zur Frist. Migriere auf die V4-Namen und teste Output-Länge, Tool Calls, JSON-Verhalten, Latenz und Kosten, bevor Produktionsverkehr daran hängt.
DeepSeek V4 Preise
Der Rabatt zählt, also datiere deine Zahlen.
DeepSeek listet Preise pro 1M Tokens. Am 10. Mai 2026 hat V4 Flash den normalen Listenpreis, während V4 Pro mit einem temporären Rabatt von 75% angezeigt wird. DeepSeek sagt, dass dieser Rabatt bis zum 31. Mai 2026 um 15:59 UTC läuft.
DeepSeek V4 API-Preise am 10. Mai 2026
| Modell | Cache-Hit Input | Cache-Miss Input | Output |
|---|---|---|---|
| DeepSeek V4 Flash | $0.0028 | $0.14 | $0.28 |
| DeepSeek V4 Pro | $0.003625 rabattiert von $0.0145 | $0.435 rabattiert von $1.74 | $0.87 rabattiert von $3.48 |
Source: DeepSeek Models & Pricing
Der Cache-Hit-Preis ist leicht zu übersehen. DeepSeek sagt, dass er ab dem 26. April 2026 um 12:15 UTC auf ein Zehntel des Startpreises gesenkt wurde. Wenn dein Workload lange System-Prompts oder geteilten Kontext wiederverwendet, ändert das die Rechnung deutlich.
Für Kaufentscheidungen aktuelle Preise prüfen
Die V4-Pro-Preise oben enthalten einen temporären Rabatt. Wenn du das nach dem 31. Mai 2026 liest, prüfe DeepSeeks Preisseite, bevor du Kosten vergleichst.
Benchmarks und Performance-Claims
Was DeepSeek sagt, und was wir nicht behaupten.
DeepSeeks Release Note macht starke Aussagen zur Leistung, aber die Textversion der offiziellen Seite zeigt nicht alle Benchmark-Tabellen sauber. Deshalb bleibt dieser Guide bewusst vorsichtig.
Offizielle Performance-Claims in der Release Note
| Bereich | DeepSeeks offizieller Claim |
|---|---|
| Agentisches Coding | V4 Pro wird als Open-Source-SOTA in agentischen Coding-Benchmarks beschrieben |
| Weltwissen | V4 Pro wird als führend unter aktuellen offenen Modellen beschrieben, nur hinter Gemini 3.1 Pro |
| Reasoning | V4 Pro soll aktuelle offene Modelle in Math, STEM und Coding schlagen |
| V4 Flash | DeepSeek sagt, V4 Flash kommt beim Reasoning nahe an V4 Pro heran |
| Einfache Agentenaufgaben | DeepSeek sagt, V4 Flash liegt bei einfachen Agentenaufgaben gleichauf mit V4 Pro |
Source: DeepSeek V4 Preview Release
Das sind offizielle DeepSeek-Claims. Sie sind hilfreich, bleiben aber Anbieter-Claims. Ich füge hier keine Drittanbieterzahlen hinzu, weil diese Aktualisierung nur auf offiziellen Quellen beruht.
Architektur-Notizen
Was DeepSeek im V4-Release direkt nennt.
Der alte Artikel sprach viel über Engram und mHC. Das können interessante DeepSeek-Forschungslinien sein, aber die offizielle V4 Preview Release Note nennt andere Punkte ausdrücklich.
Architektur und Fähigkeiten laut DeepSeek
| Punkt | Was DeepSeek sagt |
|---|---|
| DeepSeek Sparse Attention | V4 nutzt tokenweise Kompression plus DSA |
| Langer Kontext | 1M Kontext ist in offiziellen DeepSeek-Services als Standard gelistet |
| Agenten-Integrationen | DeepSeek sagt, V4 ist mit Agenten wie Claude Code, OpenClaw und OpenCode integriert |
| API-Kompatibilität | OpenAI ChatCompletions und Anthropic APIs werden unterstützt |
| Modi | Beide V4-Modelle unterstützen Thinking und Non-Thinking |
Source: DeepSeek V4 Preview Release
Die saubere Kurzbeschreibung: DeepSeek setzt mit V4 auf langen Kontext, günstige Inferenz und Agenten-Workflows. Für technische Details lohnt der offizielle technische Bericht aus der Release Note.
Migrations-Checkliste
Was vor Produktionsverkehr getestet werden sollte.
DeepSeek V4 Migration
- 1deepseek-chat oder deepseek-reasoner durch deepseek-v4-flash oder deepseek-v4-pro ersetzen
- 2Base URL behalten, außer du wechselst zwischen OpenAI-Format und Anthropic-Format
- 3Für jeden Call entscheiden, ob Thinking oder Non-Thinking nötig ist
- 4JSON Output, Tool Calls und FIM Completion testen, falls deine App darauf angewiesen ist
- 5Output-Annahmen prüfen, weil DeepSeek 384K maximalen Output listet
- 6Kosten getrennt nach Cache-Hit und Cache-Miss berechnen
- 7Jede V4-Pro-Kostenrechnung datieren, weil der Rabatt temporär ist
Für die meisten Apps ist V4 Flash der erste Test. Es ist viel günstiger, die alten Kompatibilitätsnamen routen dorthin, und DeepSeek positioniert es für wirtschaftlichen Produktionseinsatz. V4 Pro lohnt sich, wenn die Aufgabe das größere Modell wirklich rechtfertigt.
Fazit
DeepSeek V4 ist jetzt real. Sorgfalt braucht es bei Preisen und Migration.
Die alte Version dieses Artikels drehte sich um eine Frage, die beantwortet ist. DeepSeek V4 Preview ist live. Die offiziellen Docs geben Modellnamen, Kontextlänge, API-Formate, Features, Preise, offene Gewichte und eine Frist für alte Kompatibilitätsnamen.
Der wichtigste praktische Punkt ist der Preis. V4 Flash ist beim Output extrem günstig, und V4 Pro ist temporär rabattiert. Alte Kostenvergleiche veralten dadurch schnell. Für Produktion solltest du die aktuelle DeepSeek-Preisseite nutzen, nicht eine kopierte Zahl aus einem alten Post.
Meine praktische Einschätzung: V4 Flash als Standardkandidat für kostenbewusste Agenten- und Long-Context-Arbeit testen. V4 Pro nur dort testen, wo die Aufgabe es wirklich braucht. Wenn du noch deepseek-chat oder deepseek-reasoner nutzt, migriere vor dem 24. Juli 2026.
Für die breitere Modellwahl gibt es unsere Claude Opus 4.7 vs GPT-5.2 vs Gemini 3.1 Pro vs DeepSeek V4 Analyse. Wenn vor allem der Preis zählt, rechne deinen Use Case im KI-Kostenrechner durch.
Weiterlesen
Brauchst du Hilfe bei der Modellwahl?
Nutze unseren kostenlosen AI Model Picker, um Modelle nach Use Case, Budget und Workflow zu vergleichen.
AI Model Picker öffnen


