Newsletter Subscribe
Enter your email address below and subscribe to our newsletter

reuters+1scmpchannelnewsasia+1Çinli yemek teslimatı devi Meituan, Salı günü tamamen yerli üretim çipler üzerinde eğitilmiş 1,6 trilyon parametreli büyük dil modeli LongCat-2.0'ı yayınladı ve açık kaynaklı hale getirdi. Şirket, bunun 50.000 Çin yapımı işlemciden oluşan bir küme üzerinde oluşturulan ve çalıştırılan dünyanın ilk trilyon parametreli yapay zeka sistemi olduğunu iddia ediyor.money.usnews+1
GitHub ve Hugging Face üzerinde esnek MIT Lisansı ile yayınlanan Mixture-of-Experts (Uzmanlar Karışımı) modeli, bir milyon tokenlik bir bağlam penceresine sahip ve otonom kodlama, yazılım mühendisliği ve yapay zeka ajanı görevleri için tasarlandı. Meituan, LongCat-2.0'ın performansının Google'ın Alphabet Inc. Gemini 3.1 Pro'su ile karşılaştırılabilir olduğunu ve temel kıyaslamalarda OpenAI'ın GPT-5.5 ve Anthropic'in Claude Opus'u dahil olmak üzere birçok önde gelen tescilli modele denk geldiğini veya onları geçtiğini belirtti.channelnewsasia+2
Bu sürüm, Çin'in Nvidia donanımına güvenmeden sınır yapay zeka geliştirme çabalarında kayda değer bir ilerlemeyi işaret ediyor. South China Morning Post'a göre, Nisan ayında piyasaya sürülen DeepSeek V4-pro, yerli çipleri yalnızca çıkarım (eğitilmiş bir modeli çalıştırma süreci) için kullanırken, LongCat-2.0 hem ön eğitim hem de çıkarım için Çinli ASIC çiplerini kullandı.scmp
Meituan, bir açıklamada çip üreticisinin adını vermeden, "LongCat-2.0, artık yerli bilgi işlem kümeleri üzerinde büyük ölçekli modelleri eğitme kapasitesine sahip olduğumuzu kanıtladı" dedi.wtaq+1
Meituan'ın yapay zeka araştırma ekibi, 2023 yılında yerli çiplerin kullanımını araştırmaya başladı. Model daha önce anonim olarak "Owl Alpha" adıyla biliniyordu ve kimliği açıklanmadan önce OpenRouter geliştirici sıralamalarında zirvede yer alıyordu.techxplore+2
1,6 trilyon parametre ile LongCat-2.0, Meituan'ı DeepSeek'in en son amiral gemisi V4-pro modeliyle aynı seviyeye getiriyor. Bu ölçek, şirketin 560 milyar parametreye sahip önceki LongCat-Flash modeline göre bir sıçramayı temsil ediyor.medium.datadriveninvestor+1
Model, Meituan'ın "on binlerce yapay zeka ASIC süper podundan oluşan büyük ölçekli kümeler" olarak tanımladığı bir yapı üzerine inşa edildi ve "alternatif donanım platformlarında sınır ölçekli eğitim yürütme" yeteneğini gösterdi. MIT Lisansı altındaki açık kaynaklı sürüm, onu ticari olarak en esnek büyük ölçekli yapay zeka modellerinden biri haline getirerek geliştiricilerin onu kısıtlama olmaksızın değiştirmesine ve yeniden dağıtmasına olanak tanıyor.scmp+2