DeepSeek plant V4-Start für Mitte Juli mit neuer API-Preisgestaltung

14 sources
  • DeepSeek gab am Sonntag bekannt, dass sein V4-Modell offiziell Mitte Juli mit einer API-Preisgestaltung für Spitzen- und Nebenzeiten starten wird, die die Raten während der Stoßzeiten verdoppelt.
  • Das Team hat zudem DSpark als Open-Source veröffentlicht, ein Framework für spekulative Dekodierung, das in Zusammenarbeit mit der Peking-Universität entwickelt wurde und die Generierung pro Nutzer um bis zu 85 % beschleunigt.
  • DSpark ist bereits in den Produktionssystemen von DeepSeek im Einsatz und funktioniert mit Modellen von Drittanbietern, darunter Qwen von Alibaba und Gemma von Google.
Sources (14)
  1. 1 DeepSeek V4 is scheduled for mid-July, with concurrent ... news.futunn.com
  2. 2 DeepSeek Releases DSpark, a Speculative Decoding Framework ... www.marktechpost.com
  3. 3 DeepSeek DSpark Boosts Generation Speed by 85% in First Post ... pandaily.com
  4. 4 DeepSeek-AI and Peking University open-source DSpark, using ... digg.com
  5. 5 Open Source Speculative Decoding for 85% Faster Inference www.youtube.com
  6. 6 DSpark - DeepSeek Just Made Inference 85% Faster - YouTube www.youtube.com
  7. 7 DeepSpec: a full-stack codebase for training and ... - GitHub github.com
  8. 8 DeepSeek's DSpark Brings Speculative Decoding Back Into the ... dev.to
  9. 9 Open Source Inference Frameworks - Aussie AI www.aussieai.com
  10. 10 hemingkx/SpecDec: Codes for our paper "Speculative Decoding github.com
  11. 11 Best Inference Framework & Open Models for Orchestrator-Workers ... forums.developer.nvidia.com
  12. 12 mscheong01/speculative_decoding.c: minimal C implementation of ... github.com
  13. 13 DSpark: Speculative decoding accelerates LLM inference [pdf] www.reddit.com
  14. 14 DeepSpec/DSpark_paper.pdf at main · deepseek-ai ... - GitHub github.com

Schreibe einen Kommentar

Your email address will not be published. Required fields are marked *

Stay informed and not overwhelmed, subscribe now!