رابط چتهوش مصنوعی گروک (Grok) اکنون جهان اطراف را میبیند

رابط چتهوش مصنوعی گروک (Grok) اکنون جهان اطراف را میبیند
به گزارش سیلاد، این ویژگی که مشابه قابلیتهای بینایی رقبایی مانند جمینای گوگل و چتجیپیتی است، به کاربران اجازه میدهد با نشانهگیری دوربین به سمت اشیا، متون یا اسناد، سوالات خود را مطرح کنند.
جزئیات فنی:
دسترسی: Grok Vision فعلاً تنها در اپلیکیشن iOS و برای کاربران طرح SuperGrok با هزینه ۳۰ دلار ماهانه قابل استفاده است.
کاربردها:
• شناسایی محصولات، علائم راهنمایی و اسناد
• پاسخگویی به سوالات درباره محیط اطراف (مثلاً «این چه چیزی است؟»)
• تحلیل متون تصویری با ترجمه لحظهای.
بهروزرسانیهای همزمان: Xai دو ویژگی دیگر نیز معرفی کرد:
• پشتیبانی چندزبانه صوتی در حالت گفتاری (اسپانیایی، فرانسوی، ترکی، ژاپنی و هندی).
• جستجوی زنده در حالت صوتی که پاسخها را براساس جدیدترین اطلاعات ارائه میدهد.
پیشینه توسعه: این بروزرسانی پس از معرفی حافظه مکالمات (Memory) و ابزار طراحی مدارک و اپلیکیشنها در اوایل آوریل ۲۰۲۵ عرضه شد.
نسخه Grok-1.5 Vision که در آوریل ۲۰۲۴ رونمایی شده بود، توانایی پردازش نمودارها، اسکرینشاتها و تصاویر پیچیده را داشت اما قابلیت تحلیل زنده تصاویر را شامل نمیشد.
چالشها: با وجود پیشرفتها، Grok هنوز در مواردی مانند تشخیص شوخیهای کاربران (مثلاً درباره خورشیدگرفتگی) دچار خطا میشود. همچنین محدودیت جغرافیایی دسترسی به این سرویس در اتحادیه اروپا به دلیل قوانین جدید هوش مصنوعی این منطقه وجود دارد.
Grok Vision گامی بلند در ادغام پردازش چندوجهی (متن، صدا و تصویر) است، هرچند محدودیتهای فنی و حقوقی چالشهایی برای گسترش جهانی آن ایجاد کرده است.