DeepSeek, yeni API fiyatlandırmasıyla Temmuz ortasında V4 lansmanını hedefliyor

DeepSeek, Pazar günü yaptığı açıklamada, V4 modelinin Temmuz ortasında, yoğun saatlerde fiyatları ikiye katlayan bir API fiyatlandırma sistemiyle resmi olarak piyasaya sürüleceğini duyurdu.news.futunn
Ekip ayrıca, Pekin Üniversitesi ile ortaklaşa geliştirilen ve kullanıcı başına üretimi %85'e kadar hızlandıran spekülatif bir kod çözme çerçevesi olan DSpark'ı açık kaynaklı hale getirdi.marktechpost+1
DSpark, DeepSeek'in üretim sistemlerinde halihazırda kullanılıyor ve Alibaba'nın Qwen ve Google'ın Gemma modelleri dahil olmak üzere üçüncü taraf modellerle çalışıyor.digg+1

Pekin Üniversitesi ve DeepSeek'ten araştırmacılar, 27 Haziran'da, büyük dil modeli çıkarımını canlı üretim sistemlerinde kullanıcı başına yüzde 60 ila 85 oranında hızlandıran açık kaynaklı bir spekülatif kod çözme çerçevesi olan DSpark'ı yayınladı. Bu, Çinli yapay zeka laboratuvarının 7 milyar dolarlık fonlama turundan bu yana gerçekleştirdiği ilk büyük teknik sürüm oldu.marktechpost+2

DSpark Nasıl Çalışır?

Spekülatif kod çözme, metin üretimini iki role ayırır: küçük ve hızlı bir taslak model bir dizi token önerir, tam hedef model ise bu grubu tek bir geçişte doğrular ve kabul ettiği tüm token'ları tutar. DSpark, önceki yaklaşımları iki eklemeyle geliştirir. İlk olarak, sıfırdan ayrı bir taslak model eğitmek yerine, hafif bir spekülatif başlığı doğrudan mevcut model kontrol noktasına ekler; bu da temel modelin çıktı kalitesinin değişmediği anlamına gelir. İkinci olarak, bir güven puanlama sistemi her taslak token'a doğrulamayı geçme olasılığı verirken, donanım duyarlı bir zamanlayıcı, mevcut GPU yüküne göre kaç token'ın kontrol edileceğini ayarlar. Trafik hafif olduğunda sistem daha uzun tahmin dizilerini doğrular; trafik yoğun olduğunda ise düşük güvenli token'ları işlem gücü tüketmeden önce atar.digg+3

Performans ve Uyumluluk

DeepSeek'in gerçek kullanıcı trafiğini işleyen çevrimiçi üretim ortamında DSpark, DeepSeek'in önceki MTP-1 temel çizgisine kıyasla V4-Flash'ta yüzde 60 ila 85, V4-Pro'da ise yüzde 57 ila 78 daha hızlı tek kullanıcılı üretim sağladı. Belirli gecikme koşulları altında, verim kazanımları Flash'ta yüzde 661'e, Pro'da ise yüzde 406'ya kadar ulaştı. Çevrimdışı kıyaslamalar, kabul edilen token uzunluğunun Eagle3'e göre yüzde 26 ila 31, DFlash'a göre ise yüzde 16 ila 18 arttığını gösterdi.youtube+2

Çerçeve modelden bağımsızdır. DeepSeek, Alibaba'nın Qwen3 ve Google'ın Alphabet Inc. Gemma kontrol noktalarıyla uyumluluğu gösterdi. Ekip, DSpark ile birlikte, spekülatif kod çözme taslaklarını eğitmek ve değerlendirmek için tam yığın bir kod tabanı olan DeepSpec'i de MIT lisansı altında GitHub'da açık kaynak olarak yayınladı.marktechpost+3

Daha Geniş Bağlam

Bu sürüm, DeepSeek'in V4 modelini Temmuz ortasında yeni bir yoğun ve yoğun olmayan API fiyatlandırma mekanizmasıyla resmi olarak piyasaya sürmeye hazırlandığı bir dönemde geldi. DSpark, DeepSeek'in çevrimiçi hizmetlerinde halihazırda tamamen konuşlandırılmış durumda ve geçersiz doğrulamalardan kaynaklanan GPU işlem gücü israfını azaltırken, temel modelle aynı çıktı kalitesini koruyor. DeepSeek kurucusu Liang Wenfeng, "DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation" başlıklı eşlik eden makalenin ortak yazarlığını yaptı.pandaily+1

Sources (14)

1 DeepSeek V4 is scheduled for mid-July, with concurrent ... news.futunn.com
2 DeepSeek Releases DSpark, a Speculative Decoding Framework ... www.marktechpost.com
3 DeepSeek DSpark Boosts Generation Speed by 85% in First Post ... pandaily.com
4 DeepSeek-AI and Peking University open-source DSpark, using ... digg.com
5 Open Source Speculative Decoding for 85% Faster Inference www.youtube.com
6 DSpark - DeepSeek Just Made Inference 85% Faster - YouTube www.youtube.com
7 DeepSpec: a full-stack codebase for training and ... - GitHub github.com
8 DeepSeek's DSpark Brings Speculative Decoding Back Into the ... dev.to
9 Open Source Inference Frameworks - Aussie AI www.aussieai.com
10 hemingkx/SpecDec: Codes for our paper "Speculative Decoding github.com
11 Best Inference Framework & Open Models for Orchestrator-Workers ... forums.developer.nvidia.com
12 mscheong01/speculative_decoding.c: minimal C implementation of ... github.com
13 DSpark: Speculative decoding accelerates LLM inference [pdf] www.reddit.com
14 DeepSpec/DSpark_paper.pdf at main · deepseek-ai ... - GitHub github.com

Breaking News

Popular News

DeepSeek, yeni API fiyatlandırmasıyla Temmuz ortasında V4 lansmanını hedefliyor

DSpark Nasıl Çalışır?

Performans ve Uyumluluk

Daha Geniş Bağlam

Leave a ReplyCancel Reply

Stay informed and not overwhelmed, subscribe now!

Newsletter Subscribe

DSpark Nasıl Çalışır?

Performans ve Uyumluluk

Daha Geniş Bağlam

Related Posts

JWST, şimdiye kadar görülen en uzak çubuklu sarmal galaksiyi tespit etti

Huawei, Tau Ölçeklendirme Yasasını destekleyen seri üretim verilerini yayınladı

Micron, yapay zeka bellek çipleri için 9 milyar dolarlık Hiroşima genişletme projesinin temelini attı

Leave a ReplyCancel Reply

Stay informed and not overwhelmed, subscribe now!