Η DeepSeek στοχεύει στην κυκλοφορία του V4 στα μέσα Ιουλίου με νέα τιμολόγηση API

June 29, 2026

Η DeepSeek ανακοίνωσε την Κυριακή ότι το μοντέλο V4 θα κυκλοφορήσει επίσημα στα μέσα Ιουλίου με τιμολόγηση API αιχμής-εκτός αιχμής, η οποία διπλασιάζει τις χρεώσεις κατά τις ώρες αιχμής.news.futunn
Η ομάδα διέθεσε επίσης ως ανοιχτού κώδικα το DSpark, ένα πλαίσιο εικαστικής αποκωδικοποίησης (speculative decoding) που αναπτύχθηκε σε συνεργασία με το Πανεπιστήμιο του Πεκίνου και επιταχύνει τη δημιουργία περιεχομένου ανά χρήστη έως και 85%.marktechpost+1
Το DSpark έχει ήδη αναπτυχθεί στα συστήματα παραγωγής της DeepSeek και λειτουργεί με μοντέλα τρίτων, συμπεριλαμβανομένων των Qwen της Alibaba και Gemma της Google.digg+1

Ερευνητές από το Πανεπιστήμιο του Πεκίνου και την DeepSeek κυκλοφόρησαν στις 27 Ιουνίου το DSpark, ένα πλαίσιο εικαστικής αποκωδικοποίησης ανοιχτού κώδικα που επιταχύνει τη συναγωγή μεγάλων γλωσσικών μοντέλων κατά 60 έως 85 τοις εκατό ανά χρήστη σε ζωντανά συστήματα παραγωγής, σηματοδοτώντας την πρώτη σημαντική τεχνική κυκλοφορία του κινεζικού εργαστηρίου τεχνητής νοημοσύνης μετά τον γύρο χρηματοδότησης ύψους 7 δισεκατομμυρίων δολαρίων.marktechpost+2

Πώς λειτουργεί το DSpark

Η εικαστική αποκωδικοποίηση χωρίζει τη δημιουργία κειμένου σε δύο ρόλους: ένα μικρό, γρήγορο μοντέλο προσχεδίου προτείνει μια παρτίδα διακριτικών (tokens) και το πλήρες μοντέλο-στόχος επαληθεύει αυτή την παρτίδα σε ένα μόνο πέρασμα, διατηρώντας όλα τα διακριτικά με τα οποία συμφωνεί. Το DSpark βελτιώνει τις προηγούμενες προσεγγίσεις με δύο προσθήκες. Πρώτον, αντί για την εκπαίδευση ενός ξεχωριστού μοντέλου προσχεδίου από το μηδέν, ενσωματώνει μια ελαφριά κεφαλή εικαστικής αποκωδικοποίησης απευθείας στο υπάρχον σημείο ελέγχου (checkpoint) του μοντέλου — πράγμα που σημαίνει ότι η ποιότητα εξόδου του υποκείμενου μοντέλου παραμένει αμετάβλητη. Δεύτερον, ένα σύστημα βαθμολόγησης εμπιστοσύνης δίνει σε κάθε προτεινόμενο διακριτικό μια πιθανότητα επιβίωσης της επαλήθευσης, ενώ ένας προγραμματιστής με επίγνωση του υλικού προσαρμόζει πόσα διακριτικά ελέγχονται με βάση το τρέχον φορτίο της GPU. Όταν η κίνηση είναι χαμηλή, το σύστημα επαληθεύει μεγαλύτερες σειρές εικασιών· όταν η κίνηση είναι έντονη, απορρίπτει τα διακριτικά χαμηλής εμπιστοσύνης πριν καταναλώσουν υπολογιστική ισχύ.digg+3

Απόδοση και συμβατότητα

Στο διαδικτυακό περιβάλλον παραγωγής της DeepSeek που διαχειρίζεται πραγματική κίνηση χρηστών, το DSpark απέδωσε 60 έως 85 τοις εκατό ταχύτερη δημιουργία για έναν χρήστη στο V4-Flash και 57 έως 78 τοις εκατό στο V4-Pro σε σύγκριση με την προηγούμενη βάση αναφοράς MTP-1 της DeepSeek. Υπό ορισμένες συνθήκες καθυστέρησης, τα κέρδη στη διακίνηση έφτασαν έως και το 661 τοις εκατό στο Flash και το 406 τοις εκατό στο Pro. Τα benchmarks εκτός σύνδεσης έδειξαν ότι το μήκος των αποδεκτών διακριτικών αυξήθηκε κατά 26 έως 31 τοις εκατό σε σχέση με το Eagle3 και 16 έως 18 τοις εκατό σε σχέση με το DFlash.youtube+2

Το πλαίσιο είναι ανεξάρτητο από το μοντέλο. Η DeepSeek απέδειξε τη συμβατότητα με τα σημεία ελέγχου Qwen3 της Alibaba και Gemma της Alphabet Inc. . Παράλληλα με το DSpark, η ομάδα διέθεσε ως ανοιχτού κώδικα το DeepSpec, μια βάση κώδικα πλήρους στοίβας για την εκπαίδευση και την αξιολόγηση συντακτών εικαστικής αποκωδικοποίησης, όλα υπό άδεια MIT στο GitHub.marktechpost+3

Ευρύτερο πλαίσιο

Η κυκλοφορία έρχεται καθώς η DeepSeek προετοιμάζεται να λανσάρει επίσημα το μοντέλο V4 στα μέσα Ιουλίου με έναν νέο μηχανισμό τιμολόγησης API αιχμής και εκτός αιχμής. Το DSpark είναι ήδη πλήρως αναπτυγμένο στις διαδικτυακές υπηρεσίες της DeepSeek, μειώνοντας τη σπατάλη υπολογιστικής ισχύος GPU από άκυρες επαληθεύσεις, διατηρώντας παράλληλα την ποιότητα εξόδου πανομοιότυπη με το βασικό μοντέλο. Ο ιδρυτής της DeepSeek, Liang Wenfeng, συνέγραψε τη συνοδευτική εργασία με τίτλο "DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation."pandaily+1

Sources (14)

1 DeepSeek V4 is scheduled for mid-July, with concurrent ... news.futunn.com
2 DeepSeek Releases DSpark, a Speculative Decoding Framework ... www.marktechpost.com
3 DeepSeek DSpark Boosts Generation Speed by 85% in First Post ... pandaily.com
4 DeepSeek-AI and Peking University open-source DSpark, using ... digg.com
5 Open Source Speculative Decoding for 85% Faster Inference www.youtube.com
6 DSpark - DeepSeek Just Made Inference 85% Faster - YouTube www.youtube.com
7 DeepSpec: a full-stack codebase for training and ... - GitHub github.com
8 DeepSeek's DSpark Brings Speculative Decoding Back Into the ... dev.to
9 Open Source Inference Frameworks - Aussie AI www.aussieai.com
10 hemingkx/SpecDec: Codes for our paper "Speculative Decoding github.com
11 Best Inference Framework & Open Models for Orchestrator-Workers ... forums.developer.nvidia.com
12 mscheong01/speculative_decoding.c: minimal C implementation of ... github.com
13 DSpark: Speculative decoding accelerates LLM inference [pdf] www.reddit.com
14 DeepSpec/DSpark_paper.pdf at main · deepseek-ai ... - GitHub github.com

Breaking News

Popular News

Η DeepSeek στοχεύει στην κυκλοφορία του V4 στα μέσα Ιουλίου με νέα τιμολόγηση API

Πώς λειτουργεί το DSpark

Απόδοση και συμβατότητα

Ευρύτερο πλαίσιο

Υποβολή απάντησηςΑκύρωση απάντησης

Stay informed and not overwhelmed, subscribe now!

Newsletter Subscribe

Πώς λειτουργεί το DSpark

Απόδοση και συμβατότητα

Ευρύτερο πλαίσιο

Σχετικά Άρθρα

Το JWST εντόπισε τον πιο μακρινό ραβδωτό σπειροειδή γαλαξία που έχει παρατηρηθεί ποτέ

Η Huawei δημοσιεύει δεδομένα μαζικής παραγωγής που υποστηρίζουν τον Νόμο Κλιμάκωσης Tau

Η Micron ξεκινά την κατασκευή επέκτασης 9 δισ. δολαρίων στη Χιροσίμα για τσιπ μνήμης AI

Υποβολή απάντησηςΑκύρωση απάντησης

Stay informed and not overwhelmed, subscribe now!