Newsletter Subscribe
Enter your email address below and subscribe to our newsletter

news.futunnmarktechpost+1digg+1Պեկինի համալսարանի և DeepSeek-ի հետազոտողները հունիսի 27-ին թողարկեցին DSpark-ը՝ բաց կոդով սպեկուլյատիվ ապակոդավորման շրջանակ, որն արագացնում է լեզվական մեծ մոդելների եզրակացությունը 60-ից 85 տոկոսով մեկ օգտատիրոջ համար կենդանի արտադրական համակարգերում, ինչը չինական AI լաբորատորիայի առաջին խոշոր տեխնիկական թողարկումն է 7 միլիարդ դոլարի ֆինանսավորման փուլից հետո:marktechpost+2
Սպեկուլյատիվ ապակոդավորումը տեքստի գեներացումը բաժանում է երկու դերի. փոքր, արագ «սևագրային» մոդելը առաջարկում է նշանների (tokens) խմբաքանակ, իսկ ամբողջական թիրախային մոդելը ստուգում է այդ խմբաքանակը մեկ անցումով և պահպանում է բոլոր այն նշանները, որոնց համաձայն է: DSpark-ը բարելավում է նախորդ մոտեցումները երկու հավելումով: Նախ, փոխարենը զրոյից առանձին սևագրային մոդել մարզելու, այն ավելացնում է թեթև սպեկուլյատիվ գլուխ անմիջապես առկա մոդելի ստուգման կետին, ինչը նշանակում է, որ հիմքում ընկած մոդելի ելքային որակը մնում է անփոփոխ: Երկրորդ, վստահության գնահատման համակարգը յուրաքանչյուր սևագրային նշանին տալիս է ստուգումը անցնելու հավանականություն, մինչդեռ սարքավորումների վրա հիմնված պլանավորողը կարգավորում է, թե քանի նշան պետք է ստուգվի՝ հիմնվելով GPU-ի ընթացիկ ծանրաբեռնվածության վրա: Երբ երթևեկությունը թեթև է, համակարգը ստուգում է ենթադրությունների ավելի երկար շարքեր. երբ երթևեկությունը ծանր է, այն մերժում է ցածր վստահության նշանները, նախքան դրանք հաշվողական ռեսուրսներ կսպառեն:digg+3
DeepSeek-ի առցանց արտադրական միջավայրում, որը մշակում է իրական օգտատերերի երթևեկությունը, DSpark-ը ապահովել է 60-ից 85 տոկոսով ավելի արագ մեկ օգտատիրոջ գեներացում V4-Flash-ի վրա և 57-ից 78 տոկոսով V4-Pro-ի վրա՝ համեմատած DeepSeek-ի նախորդ MTP-1 բազային գծի հետ: Որոշակի լատենտային պայմաններում թողունակության աճը հասել է 661 տոկոսի Flash-ի վրա և 406 տոկոսի Pro-ի վրա: Օֆլայն թեստերը ցույց են տվել, որ ընդունված նշանների երկարությունը աճել է 26-ից 31 տոկոսով Eagle3-ի համեմատ և 16-ից 18 տոկոսով DFlash-ի համեմատ:youtube+2
Շրջանակը մոդելներից անկախ է: DeepSeek-ը ցույց է տվել համատեղելիություն Alibaba-ի Qwen3-ի և Google-ի Alphabet Inc.-ի Gemma-ի ստուգման կետերի հետ: DSpark-ի հետ մեկտեղ թիմը հրապարակեց DeepSpec-ը՝ ամբողջական ստեկի կոդային բազա սպեկուլյատիվ ապակոդավորման սևագրերի պատրաստման և գնահատման համար, ամեն ինչ MIT լիցենզիայով GitHub-ում:marktechpost+3
Թողարկումը տեղի է ունենում այն ժամանակ, երբ DeepSeek-ը պատրաստվում է հուլիսի կեսերին պաշտոնապես գործարկել իր V4 մոդելը՝ API-ի գնագոյացման նոր պիկ և ոչ պիկ մեխանիզմով: DSpark-ն արդեն ամբողջությամբ ներդրված է DeepSeek-ի առցանց ծառայություններում՝ նվազեցնելով GPU-ի հաշվողական ռեսուրսների վատնումը սխալ ստուգումների պատճառով՝ միաժամանակ պահպանելով ելքային որակը, որը նույնական է բազային մոդելին: DeepSeek-ի հիմնադիր Լիանգ Վենֆենգը եղել է «DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation» վերնագրով ուղեկցող աշխատության համահեղինակը:pandaily+1