Newsletter Subscribe
Enter your email address below and subscribe to our newsletter

reuters+1scmpchannelnewsasia+1Den kinesiska matleveransjätten Meituan släppte på tisdagen LongCat-2.0 som öppen källkod. Det är en stor språkmodell med 1,6 biljoner parametrar som tränats helt på inhemskt producerade chip – vad företaget hävdar är världens första AI-system med en biljon parametrar som byggts och körts på ett kluster av 50 000 kinesisktillverkade processorer.money.usnews+1
Modellen, som bygger på "Mixture-of-Experts"-arkitektur och släppts under den tillåtande MIT-licensen på GitHub och Hugging Face, har ett kontextfönster på en miljon tokens och är utformad för autonom kodning, mjukvaruutveckling och AI-agentuppgifter. Meituan uppgav att prestandan hos LongCat-2.0 är jämförbar med Google (Alphabet Inc. ) Gemini 3.1 Pro och att den matchade eller överträffade flera ledande proprietära modeller, inklusive OpenAI GPT-5.5 och Anthropic Claude Opus, i viktiga prestandatester.channelnewsasia+2
Lanseringen markerar ett betydande framsteg i Kinas ansträngningar att utveckla avancerad AI utan att förlita sig på hårdvara från Nvidia . Medan DeepSeek V4-pro, som lanserades i april, endast använde inhemska chip för inferens – processen att köra en färdigtränad modell – använde LongCat-2.0 kinesiska ASIC-chip för både förträning och inferens, enligt South China Morning Post.scmp
"LongCat-2.0 har visat att vi nu har kapacitet att träna storskaliga modeller på inhemska datorkluster", sade Meituan i ett uttalande, utan att namnge chiptillverkaren.wtaq+1
Meituans AI-forskningsteam började utforska användningen av inhemska chip under 2023. Modellen var tidigare känd under det anonyma namnet "Owl Alpha" och hade toppat OpenRouter-utvecklarrankningar innan dess identitet avslöjades.techxplore+2
Med 1,6 biljoner parametrar placerar sig LongCat-2.0 i nivå med DeepSeeks senaste flaggskeppsmodell V4-pro. Skalan representerar ett språng från företagets tidigare LongCat-Flash, som hade 560 miljarder parametrar.medium.datadriveninvestor+1
Modellen byggdes på vad Meituan beskrev som "storskaliga kluster av tiotusentals AI ASIC-superpods", vilket demonstrerar dess förmåga att "genomföra träning i framkantsskala på alternativa hårdvaruplattformar". Att den släpps som öppen källkod under en MIT-licens gör den till en av de mest kommersiellt flexibla storskaliga AI-modellerna som finns tillgängliga, vilket gör att utvecklare kan ändra och distribuera den utan begränsningar.scmp+2