DeepSeek ივლისის შუა რიცხვებში V4-ის გაშვებას და API-ის ახალ ფასებს გეგმავს

June 29, 2026

DeepSeek-მა კვირას განაცხადა, რომ მისი V4 მოდელი ოფიციალურად ივლისის შუა რიცხვებში გაეშვება API-ის პიკური და არაპიკური ფასებით, რაც დატვირთულ საათებში ტარიფებს აორმაგებს.news.futunn
გუნდმა ასევე გამოაქვეყნა DSpark, სპეკულაციური დეკოდირების ჩარჩო, რომელიც შემუშავებულია პეკინის უნივერსიტეტთან ერთად და ზრდის გენერირების სიჩქარეს თითო მომხმარებელზე 85%-მდე.marktechpost+1
DSpark უკვე დანერგილია DeepSeek-ის საწარმოო სისტემებში და მუშაობს მესამე მხარის მოდელებთან, მათ შორის Alibaba-ს Qwen-თან და Google-ის Gemma-სთან.digg+1

პეკინის უნივერსიტეტისა და DeepSeek-ის მკვლევარებმა 27 ივნისს გამოუშვეს DSpark, ღია კოდის სპეკულაციური დეკოდირების ჩარჩო, რომელიც აჩქარებს დიდი ენობრივი მოდელის დასკვნას 60-დან 85 პროცენტამდე თითო მომხმარებელზე ცოცხალ საწარმოო სისტემებში. ეს არის ჩინური AI ლაბორატორიის პირველი მნიშვნელოვანი ტექნიკური რელიზი 7 მილიარდი დოლარის დაფინანსების რაუნდის შემდეგ.marktechpost+2

როგორ მუშაობს DSpark

სპეკულაციური დეკოდირება ტექსტის გენერირებას ორ როლად ყოფს: პატარა, სწრაფი „ესკიზის“ მოდელი გვთავაზობს ტოკენების ჯგუფს, ხოლო სრული სამიზნე მოდელი ამოწმებს ამ ჯგუფს ერთ გადაცემაში და ინარჩუნებს ყველა ტოკენს, რომელსაც ეთანხმება. DSpark აუმჯობესებს წინა მიდგომებს ორი დამატებით. პირველი, ნაცვლად ცალკეული ესკიზის მოდელის ნულიდან წვრთნისა, ის ამატებს მსუბუქ სპეკულაციურ თავს პირდაპირ არსებულ მოდელის ჩეკპოინტზე, რაც ნიშნავს, რომ ძირითადი მოდელის გამომავალი ხარისხი უცვლელი რჩება. მეორე, ნდობის შეფასების სისტემა თითოეულ ესკიზურ ტოკენს ანიჭებს გადარჩენის ალბათობას, ხოლო აპარატურაზე ორიენტირებული დამგეგმავი არეგულირებს, თუ რამდენი ტოკენი შემოწმდეს GPU-ს მიმდინარე დატვირთვის მიხედვით. როდესაც ტრაფიკი დაბალია, სისტემა ამოწმებს ვარაუდების უფრო გრძელ სერიებს; როდესაც ტრაფიკი მაღალია, ის უარყოფს დაბალი ნდობის ტოკენებს, სანამ ისინი გამოთვლით რესურსს მოიხმარენ.digg+3

შესრულება და თავსებადობა

DeepSeek-ის ონლაინ საწარმოო გარემოში, რომელიც რეალურ მომხმარებელთა ტრაფიკს ამუშავებს, DSpark-მა უზრუნველყო 60-დან 85 პროცენტით უფრო სწრაფი ერთმომხმარებლიანი გენერირება V4-Flash-ზე და 57-დან 78 პროცენტამდე V4-Pro-ზე, DeepSeek-ის წინა MTP-1 ბაზისურ ხაზთან შედარებით. გარკვეულ ლატენტურ პირობებში, გამტარუნარიანობის ზრდამ 661 პროცენტს მიაღწია Flash-ზე და 406 პროცენტს Pro-ზე. ოფლაინ ტესტებმა აჩვენა, რომ მიღებული ტოკენების სიგრძე 26-დან 31 პროცენტით გაიზარდა Eagle3-თან შედარებით და 16-დან 18 პროცენტით DFlash-თან შედარებით.youtube+2

ჩარჩო მოდელებისგან დამოუკიდებელია. DeepSeek-მა აჩვენა თავსებადობა Alibaba-ს Qwen3-თან და Google-ის Alphabet Inc.-ის Gemma-ს ჩეკპოინტებთან. DSpark-თან ერთად, გუნდმა გამოაქვეყნა DeepSpec, სრული სტეკის კოდური ბაზა სპეკულაციური დეკოდირების ესკიზების მომზადებისა და შეფასებისთვის, ყველაფერი MIT ლიცენზიით GitHub-ზე.marktechpost+3

უფრო ფართო კონტექსტი

რელიზი ხდება მაშინ, როდესაც DeepSeek ემზადება თავისი V4 მოდელის ოფიციალურად გასაშვებად ივლისის შუა რიცხვებში, API-ის ფასების ახალი პიკური და არაპიკური მექანიზმით. DSpark უკვე სრულად არის დანერგილი DeepSeek-ის ონლაინ სერვისებში, რაც ამცირებს GPU-ს გამოთვლითი რესურსის ფუჭად ხარჯვას არასწორი ვერიფიკაციების გამო, ხოლო ინარჩუნებს გამომავალ ხარისხს, რომელიც იდენტურია საბაზისო მოდელის. DeepSeek-ის დამფუძნებელი ლიანგ ვენფენგი იყო თანაავტორი თანმხლები ნაშრომისა, სახელწოდებით „DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation“.pandaily+1

Sources (14)