Newsletter Subscribe
Enter your email address below and subscribe to our newsletter

reuters+1scmpchannelnewsasia+1Ο κινεζικός κολοσσός διανομής φαγητού Meituan κυκλοφόρησε την Τρίτη και διέθεσε ως ανοιχτού κώδικα το LongCat-2.0, ένα μεγάλο γλωσσικό μοντέλο 1,6 τρισεκατομμυρίων παραμέτρων εκπαιδευμένο εξ ολοκλήρου σε εγχώρια παραγόμενα τσιπ — αυτό που η εταιρεία ισχυρίζεται ότι είναι το πρώτο σύστημα τεχνητής νοημοσύνης τρισεκατομμυρίων παραμέτρων στον κόσμο που κατασκευάστηκε και λειτουργεί σε ένα σύμπλεγμα 50.000 επεξεργαστών κινεζικής κατασκευής.money.usnews+1
Το μοντέλο Mixture-of-Experts, που κυκλοφόρησε υπό την επιτρεπτική άδεια MIT στο GitHub και το Hugging Face, διαθέτει παράθυρο πλαισίου ενός εκατομμυρίου διακριτικών (tokens) και έχει σχεδιαστεί για αυτόνομη κωδικοποίηση, μηχανική λογισμικού και εργασίες πρακτόρων τεχνητής νοημοσύνης. Η Meituan δήλωσε ότι η απόδοση του LongCat-2.0 είναι συγκρίσιμη με το Gemini 3.1 Pro της Alphabet Inc. της Google και ανταγωνίζεται ή ξεπερνά αρκετά κορυφαία ιδιόκτητα μοντέλα, συμπεριλαμβανομένων του GPT-5.5 της OpenAI και του Claude Opus της Anthropic σε βασικά σημεία αναφοράς.channelnewsasia+2
Η κυκλοφορία σηματοδοτεί μια αξιοσημείωτη πρόοδο στις προσπάθειες της Κίνας να αναπτύξει τεχνητή νοημοσύνη αιχμής χωρίς να βασίζεται σε υλικό της Nvidia . Ενώ το V4-pro της DeepSeek, που κυκλοφόρησε τον Απρίλιο, χρησιμοποίησε εγχώρια τσιπ μόνο για συμπερασμό — τη διαδικασία εκτέλεσης ενός εκπαιδευμένου μοντέλου — το LongCat-2.0 χρησιμοποίησε κινεζικά τσιπ ASIC τόσο για την προ-εκπαίδευση όσο και για τον συμπερασμό, σύμφωνα με την South China Morning Post.scmp
"Το LongCat-2.0 απέδειξε ότι έχουμε πλέον τη δυνατότητα να εκπαιδεύουμε μοντέλα μεγάλης κλίμακας σε εγχώρια υπολογιστικά συμπλέγματα", ανέφερε η Meituan σε δήλωσή της, χωρίς να κατονομάσει τον κατασκευαστή των τσιπ.wtaq+1
Η ερευνητική ομάδα τεχνητής νοημοσύνης της Meituan άρχισε να εξερευνά τη χρήση εγχώριων τσιπ το 2023. Το μοντέλο ήταν προηγουμένως γνωστό ανώνυμα ως "Owl Alpha" και είχε βρεθεί στην κορυφή των κατατάξεων προγραμματιστών του OpenRouter πριν αποκαλυφθεί η ταυτότητά του.techxplore+2
Με 1,6 τρισεκατομμύρια παραμέτρους, το LongCat-2.0 φέρνει τη Meituan στο ίδιο επίπεδο με το τελευταίο κορυφαίο μοντέλο V4-pro της DeepSeek. Η κλίμακα αντιπροσωπεύει ένα άλμα από το προηγούμενο LongCat-Flash της εταιρείας, το οποίο είχε 560 δισεκατομμύρια παραμέτρους.medium.datadriveninvestor+1
Το μοντέλο κατασκευάστηκε σε αυτό που η Meituan περιέγραψε ως "συμπλέγματα μεγάλης κλίμακας από δεκάδες χιλιάδες AI ASIC superpods", αποδεικνύοντας την ικανότητά της να "διεξάγει εκπαίδευση κλίμακας αιχμής σε εναλλακτικές πλατφόρμες υλικού". Η κυκλοφορία ανοιχτού κώδικα υπό την άδεια MIT το καθιστά ένα από τα πιο εμπορικά ευέλικτα μοντέλα τεχνητής νοημοσύνης μεγάλης κλίμακας που είναι διαθέσιμα, επιτρέποντας στους προγραμματιστές να το τροποποιούν και να το αναδιανέμουν χωρίς περιορισμούς.scmp+2