Newsletter Subscribe
Enter your email address below and subscribe to our newsletter

reuters+1scmpchannelnewsasia+1Չինական սննդի առաքման հսկա Meituan-ը երեքշաբթի օրը թողարկել և բացել է LongCat-2.0-ի կոդը՝ 1,6 տրիլիոն պարամետր ունեցող լեզվական մեծ մոդել, որը լիովին մարզվել է տեղական արտադրության չիպերի վրա. ընկերությունը պնդում է, որ սա աշխարհում առաջին տրիլիոն պարամետր ունեցող AI համակարգն է, որը կառուցված և աշխատում է 50,000 չինական արտադրության պրոցեսորների կլաստերի վրա:money.usnews+1
Mixture-of-Experts մոդելը, որը հրապարակվել է MIT լիցենզիայով GitHub-ում և Hugging Face-ում, ունի մեկ միլիոն տոկենի համատեքստային պատուհան և նախատեսված է ինքնավար կոդավորման, ծրագրային ապահովման ճարտարագիտության և AI գործակալների առաջադրանքների համար: Meituan-ը հայտնել է, որ LongCat-2.0-ի արդյունավետությունը համեմատելի է Google-ի Alphabet Inc. Gemini 3.1 Pro-ի հետ և հիմնական թեստերում հավասարվել կամ գերազանցել է մի շարք առաջատար սեփական մոդելների, այդ թվում՝ OpenAI-ի GPT-5.5-ին և Anthropic-ի Claude Opus-ին:channelnewsasia+2
Այս թողարկումը նշանակալի առաջընթաց է Չինաստանի այն ջանքերում, որոնք ուղղված են սահմանային AI-ի զարգացմանը՝ առանց Nvidia սարքավորումներից կախվածության: Թեև ապրիլին թողարկված DeepSeek-ի V4-pro-ն տեղական չիպերն օգտագործել է միայն ինֆերենսի համար, LongCat-2.0-ը չինական ASIC չիպերն օգտագործել է ինչպես նախնական մարզման, այնպես էլ ինֆերենսի համար, հայտնում է South China Morning Post-ը:scmp
«LongCat-2.0-ը ցույց տվեց, որ մենք այժմ ունենք տեղական հաշվողական կլաստերների վրա լայնածավալ մոդելներ մարզելու կարողություն», – ասվում է Meituan-ի հայտարարության մեջ՝ առանց չիպեր արտադրողի անունը նշելու:wtaq+1
Meituan-ի AI հետազոտական թիմը տեղական չիպերի օգտագործման հետազոտությունը սկսել է 2023 թվականին: Մոդելը նախկինում անանուն կերպով հայտնի էր որպես «Owl Alpha» և գլխավորում էր OpenRouter-ի մշակողների վարկանիշները, մինչև դրա ինքնությունը բացահայտվեց:techxplore+2
1,6 տրիլիոն պարամետրով LongCat-2.0-ը Meituan-ին դնում է DeepSeek-ի վերջին ֆլագման V4-pro մոդելի մակարդակին: Այս մասշտաբը թռիչք է ընկերության ավելի վաղ թողարկված LongCat-Flash-ի համեմատ, որն ուներ 560 միլիարդ պարամետր:medium.datadriveninvestor+1
Մոդելը կառուցված է այն հիմքի վրա, որը Meituan-ը անվանում է «տասնյակ հազարավոր AI ASIC սուպերփոդերի լայնածավալ կլաստերներ», ինչը հաստատում է դրա կարողությունը՝ «սահմանային մասշտաբի մարզումներ անցկացնել այլընտրանքային սարքավորումային հարթակներում»: MIT լիցենզիայով բաց կոդով թողարկումը այն դարձնում է առևտրային առումով ամենաճկուն լայնածավալ AI մոդելներից մեկը, ինչը մշակողներին թույլ է տալիս փոփոխել և տարածել այն առանց սահմանափակումների:scmp+2