DeepSeek vise un lancement de la V4 mi-juillet avec une nouvelle tarification API

14 sources
  • DeepSeek a annoncé dimanche que son modèle V4 sera officiellement lancé mi-juillet avec une tarification API basée sur les pics et les creux, doublant les tarifs pendant les heures de forte affluence.
  • L'équipe a également mis en open source DSpark, un framework de décodage spéculatif co-développé avec l'Université de Pékin qui accélère la génération par utilisateur jusqu'à 85 %.
  • DSpark est déjà déployé sur les systèmes de production de DeepSeek et fonctionne avec des modèles tiers, notamment Qwen d'Alibaba et Gemma de Google.
Sources (14)
  1. 1 DeepSeek V4 is scheduled for mid-July, with concurrent ... news.futunn.com
  2. 2 DeepSeek Releases DSpark, a Speculative Decoding Framework ... www.marktechpost.com
  3. 3 DeepSeek DSpark Boosts Generation Speed by 85% in First Post ... pandaily.com
  4. 4 DeepSeek-AI and Peking University open-source DSpark, using ... digg.com
  5. 5 Open Source Speculative Decoding for 85% Faster Inference www.youtube.com
  6. 6 DSpark - DeepSeek Just Made Inference 85% Faster - YouTube www.youtube.com
  7. 7 DeepSpec: a full-stack codebase for training and ... - GitHub github.com
  8. 8 DeepSeek's DSpark Brings Speculative Decoding Back Into the ... dev.to
  9. 9 Open Source Inference Frameworks - Aussie AI www.aussieai.com
  10. 10 hemingkx/SpecDec: Codes for our paper "Speculative Decoding github.com
  11. 11 Best Inference Framework & Open Models for Orchestrator-Workers ... forums.developer.nvidia.com
  12. 12 mscheong01/speculative_decoding.c: minimal C implementation of ... github.com
  13. 13 DSpark: Speculative decoding accelerates LLM inference [pdf] www.reddit.com
  14. 14 DeepSpec/DSpark_paper.pdf at main · deepseek-ai ... - GitHub github.com

Laisser un commentaire

Your email address will not be published. Required fields are marked *

Stay informed and not overwhelmed, subscribe now!