Newsletter Subscribe
Enter your email address below and subscribe to our newsletter

reuters+1scmpchannelnewsasia+1Kiinalainen ruoankuljetusjätti Meituan julkaisi tiistaina avoimena lähdekoodina LongCat-2.0-mallin, 1,6 biljoonan parametrin suuren kielimallin, joka on koulutettu kokonaan kotimaisilla siruilla. Yhtiön mukaan kyseessä on maailman ensimmäinen biljoonan parametrin tekoälyjärjestelmä, joka on rakennettu ja ajettu 50 000 kiinalaisvalmisteisen prosessorin klusterilla.money.usnews+1
Mixture-of-Experts-malli, joka julkaistiin sallivalla MIT-lisenssillä GitHubissa ja Hugging Facessa, sisältää miljoonan tokenin konteksti-ikkunan ja on suunniteltu autonomiseen koodaukseen, ohjelmistosuunnitteluun ja tekoälyagenttitehtäviin. Meituanin mukaan LongCat-2.0:n suorituskyky on verrattavissa Googlen Alphabet Inc:n Gemini 3.1 Prohon, ja se vastasi tai ylitti useita johtavia kaupallisia malleja, mukaan lukien OpenAI:n GPT-5.5 ja Anthropicin Claude Opus, keskeisissä vertailutesteissä.channelnewsasia+2
Julkaisu merkitsee merkittävää edistysaskelta Kiinan pyrkimyksissä kehittää huipputason tekoälyä ilman riippuvuutta Nvidian laitteistosta. Vaikka huhtikuussa julkaistu DeepSeekin V4-pro käytti kotimaisia siruja vain päättelyyn – eli koulutetun mallin ajamiseen – LongCat-2.0 käytti kiinalaisia ASIC-siruja sekä esikoulutukseen että päättelyyn, kertoo South China Morning Post.scmp
"LongCat-2.0 on osoittanut, että meillä on nyt kyky kouluttaa suuren mittakaavan malleja kotimaisilla laskentaklustereilla", Meituan totesi lausunnossaan nimeämättä sirunvalmistajaa.wtaq+1
Meituanin tekoälytutkimustiimi alkoi tutkia kotimaisten sirujen käyttöä vuonna 2023. Malli tunnettiin aiemmin nimettömänä nimellä "Owl Alpha", ja se oli noussut OpenRouter-kehittäjien ranking-listojen kärkeen ennen kuin sen identiteetti paljastettiin.techxplore+2
1,6 biljoonan parametrin myötä LongCat-2.0 asettaa Meituanin samalle tasolle DeepSeekin uusimman lippulaivamallin V4-pron kanssa. Mittakaava on merkittävä harppaus yhtiön aiemmasta LongCat-Flash-mallista, jossa oli 560 miljardia parametria.medium.datadriveninvestor+1
Malli rakennettiin Meituanin kuvaamien "kymmenien tuhansien tekoäly-ASIC-superpodien laajamittaisten klustereiden" varaan, mikä osoittaa sen kyvyn "suorittaa huipputason koulutusta vaihtoehtoisilla laitteistoalustoilla". Avoimen lähdekoodin julkaisu MIT-lisenssillä tekee siitä yhden kaupallisesti joustavimmista saatavilla olevista suuren mittakaavan tekoälymalleista, mikä mahdollistaa kehittäjille sen muokkaamisen ja jakamisen ilman rajoituksia.scmp+2