Newsletter Subscribe
Enter your email address below and subscribe to our newsletter

news.futunnmarktechpost+1digg+1პეკინის უნივერსიტეტისა და DeepSeek-ის მკვლევარებმა 27 ივნისს გამოუშვეს DSpark, ღია კოდის სპეკულაციური დეკოდირების ჩარჩო, რომელიც აჩქარებს დიდი ენობრივი მოდელის დასკვნას 60-დან 85 პროცენტამდე თითო მომხმარებელზე ცოცხალ საწარმოო სისტემებში. ეს არის ჩინური AI ლაბორატორიის პირველი მნიშვნელოვანი ტექნიკური რელიზი 7 მილიარდი დოლარის დაფინანსების რაუნდის შემდეგ.marktechpost+2
სპეკულაციური დეკოდირება ტექსტის გენერირებას ორ როლად ყოფს: პატარა, სწრაფი „ესკიზის“ მოდელი გვთავაზობს ტოკენების ჯგუფს, ხოლო სრული სამიზნე მოდელი ამოწმებს ამ ჯგუფს ერთ გადაცემაში და ინარჩუნებს ყველა ტოკენს, რომელსაც ეთანხმება. DSpark აუმჯობესებს წინა მიდგომებს ორი დამატებით. პირველი, ნაცვლად ცალკეული ესკიზის მოდელის ნულიდან წვრთნისა, ის ამატებს მსუბუქ სპეკულაციურ თავს პირდაპირ არსებულ მოდელის ჩეკპოინტზე, რაც ნიშნავს, რომ ძირითადი მოდელის გამომავალი ხარისხი უცვლელი რჩება. მეორე, ნდობის შეფასების სისტემა თითოეულ ესკიზურ ტოკენს ანიჭებს გადარჩენის ალბათობას, ხოლო აპარატურაზე ორიენტირებული დამგეგმავი არეგულირებს, თუ რამდენი ტოკენი შემოწმდეს GPU-ს მიმდინარე დატვირთვის მიხედვით. როდესაც ტრაფიკი დაბალია, სისტემა ამოწმებს ვარაუდების უფრო გრძელ სერიებს; როდესაც ტრაფიკი მაღალია, ის უარყოფს დაბალი ნდობის ტოკენებს, სანამ ისინი გამოთვლით რესურსს მოიხმარენ.digg+3
DeepSeek-ის ონლაინ საწარმოო გარემოში, რომელიც რეალურ მომხმარებელთა ტრაფიკს ამუშავებს, DSpark-მა უზრუნველყო 60-დან 85 პროცენტით უფრო სწრაფი ერთმომხმარებლიანი გენერირება V4-Flash-ზე და 57-დან 78 პროცენტამდე V4-Pro-ზე, DeepSeek-ის წინა MTP-1 ბაზისურ ხაზთან შედარებით. გარკვეულ ლატენტურ პირობებში, გამტარუნარიანობის ზრდამ 661 პროცენტს მიაღწია Flash-ზე და 406 პროცენტს Pro-ზე. ოფლაინ ტესტებმა აჩვენა, რომ მიღებული ტოკენების სიგრძე 26-დან 31 პროცენტით გაიზარდა Eagle3-თან შედარებით და 16-დან 18 პროცენტით DFlash-თან შედარებით.youtube+2
ჩარჩო მოდელებისგან დამოუკიდებელია. DeepSeek-მა აჩვენა თავსებადობა Alibaba-ს Qwen3-თან და Google-ის Alphabet Inc.-ის Gemma-ს ჩეკპოინტებთან. DSpark-თან ერთად, გუნდმა გამოაქვეყნა DeepSpec, სრული სტეკის კოდური ბაზა სპეკულაციური დეკოდირების ესკიზების მომზადებისა და შეფასებისთვის, ყველაფერი MIT ლიცენზიით GitHub-ზე.marktechpost+3
რელიზი ხდება მაშინ, როდესაც DeepSeek ემზადება თავისი V4 მოდელის ოფიციალურად გასაშვებად ივლისის შუა რიცხვებში, API-ის ფასების ახალი პიკური და არაპიკური მექანიზმით. DSpark უკვე სრულად არის დანერგილი DeepSeek-ის ონლაინ სერვისებში, რაც ამცირებს GPU-ს გამოთვლითი რესურსის ფუჭად ხარჯვას არასწორი ვერიფიკაციების გამო, ხოლო ინარჩუნებს გამომავალ ხარისხს, რომელიც იდენტურია საბაზისო მოდელის. DeepSeek-ის დამფუძნებელი ლიანგ ვენფენგი იყო თანაავტორი თანმხლები ნაშრომისა, სახელწოდებით „DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation“.pandaily+1