سرتیتر خبرها

غریب آبادی: مردم ایران هرگز تسلیم تهدیدات و تجاوزات نخواهند شد و متحد و منسجم در مقابل متجاوز خواهند ایستاد

2 ماه پیش

واکنش ایران به حمله خشونت آمیز در سیدنی استرالیا

2 ماه پیش

مصر: همه گزینه‌ها از جمله راه‌حل نظامی را درمورد سد النهضه بررسی می‌کنیم

2 ماه پیش

واکنش آمریکا به تیراندازی مرگبار در سیدنی

2 ماه پیش

رضا نصری: علی‌اکبر صالحی شایسته‌ترین گزینه نه برای مدیریت یک سفارتخانه، بلکه برای عهده‌دار شدن سمت پیشنهادی «نماینده ویژه ایران در جهان عرب» است

2 ماه پیش

ادعای اوکراین درباره حملات نظامی دقیق به عمق خاک روسیه

2 ماه پیش

کیمی-کی۲: مدل زبان بزرگ چینی که رقبای جهانی را به چالش می‌کشد

زمان انتشار: 28 جولای 2025 ساعت 13:34

دسته بندی: فناوری اطلاعات

شناسه خبر: 2843656

زمان مطالعه: 4 دقیقه

کیمی-کی۲: مدل زبان بزرگ چینی که رقبای جهانی را به چالش می‌کشد

شرکت چینی «مون‌شات هوش مصنوعی» با معرفی مدل زبان بزرگ «کیمی-کی۲» (Kimi-K2)، گامی بلند در عرصه هوش مصنوعی برداشته است.

به گزارش سیلاد و به نقل از The Decoder، این مدل که به صورت اپن-وِیت منتشر شده، با یک تریلیون پارامتر و فعال‌سازی ۳۲ میلیارد پارامتر در هر استنتاج، قابلیت رقابت با مدل‌های اختصاصی پیشرو مانند کلاد سونت ۴ و جی‌پی‌تی-۴٫۱ را دارد.

بر این اساس، نسخه «کیمی-کی۲-اینستراکت» که برای استفاده عملی بهینه‌سازی شده، در تست‌های استاندارد عملکردی هم‌رده با مدل‌های بسته پیشرو نشان داده است. در آزمون SWE-bench که توانایی مدل در تشخیص و رفع خطاهای کد را می‌سنجد، این مدل با امتیاز ۶۵.۸ درصد در حالت عامل، عملکردی بهتر از جی‌پی‌تی-۴٫۱ (۵۴٫۶ درصد) و نزدیک به کلاد سونت ۴ داشته است.

گفتنی است کیمی-کی۲ بدون داشتن ماژول استدلال اختصاصی، در تست‌های برنامه‌نویسی LiveCodeBench (۵۳٫۷ درصد) و OJBench (۲۷٫۱ درصد) نیز پیشتاز است. این مدل در حل مسائل ریاضی و علمی نیز عملکرد درخشانی دارد و در آزمون‌هایی مانند AIME، GPQA-Diamond و MATH-500 از رقبا پیشی گرفته است.

مون‌شات هوش مصنوعی، کیمی-کی۲ را به‌طور ویژه برای کاربردهای عاملی طراحی کرده است. این مدل می‌تواند دستورات را اجرا کند، ابزارهای خارجی را فراخوانی کند، کد تولید و دیباگ نماید و وظایف پیچیده چندمرحله‌ای را به‌صورت مستقل مدیریت کند.

در یک نمایش نمونه، این مدل توانست داده‌های حقوقی مشاغل دورکار را تحلیل کند، ارزیابی آماری انجام دهد و یک صفحه HTML تعاملی با ابزار پیشنهاد سفارشی‌سازی شده ایجاد کند.

گفته می‌شود این مدل با الگوریتم آموزشی جدیدی به نام «میون‌کلیپ» روی ۱۵٫۵ تریلیون توکن آموزش دیده است. مون‌شات هوش مصنوعی ادعا می‌کند این الگوریتم جایگزین بهتری برای بهینه‌ساز استاندارد AdamW است و نقش کلیدی در عملکرد قوی مدل داشته است.