فناوری اطلاعات

رابط چت‌هوش مصنوعی گروک (Grok) اکنون جهان اطراف را می‌بیند

رابط چت‌هوش مصنوعی گروک (Grok) اکنون جهان اطراف را می‌بیند

شرکت xAI به رهبری ایلان ماسک، قابلیت جدیدی به نام Grok Vision را به چتبات هوش مصنوعی خود افزوده است که امکان تحلیل محیط اطراف از طریق دوربین گوشی را فراهم می‌کند.

به گزارش سیلاد، این ویژگی که مشابه قابلیت‌های بینایی رقبایی مانند جمینای گوگل و چت‌جی‌پی‌تی است، به کاربران اجازه می‌دهد با نشانه‌گیری دوربین به سمت اشیا، متون یا اسناد، سوالات خود را مطرح کنند.

جزئیات فنی:
دسترسی:  Grok Vision فعلاً تنها در اپلیکیشن iOS و برای کاربران طرح SuperGrok با هزینه ۳۰ دلار ماهانه قابل استفاده است.
کاربردها:
  شناسایی محصولات، علائم راهنمایی و اسناد
  پاسخگویی به سوالات درباره محیط اطراف (مثلاً «این چه چیزی است؟»)
  تحلیل متون تصویری با ترجمه لحظه‌ای.
 

رابط چت‌هوش مصنوعی گروک (Grok) اکنون جهان اطراف را می‌بیند

به‌روزرسانی‌های همزمان: Xai دو ویژگی دیگر نیز معرفی کرد:
  پشتیبانی چندزبانه صوتی در حالت گفتاری (اسپانیایی، فرانسوی، ترکی، ژاپنی و هندی).
  جستجوی زنده در حالت صوتی که پاسخ‌ها را براساس جدیدترین اطلاعات ارائه می‌دهد.

پیشینه توسعه: این بروزرسانی پس از معرفی حافظه مکالمات (Memory) و ابزار طراحی مدارک و اپلیکیشن‌ها در اوایل آوریل ۲۰۲۵ عرضه شد.

نسخه Grok-1.5 Vision که در آوریل ۲۰۲۴ رونمایی شده بود، توانایی پردازش نمودارها، اسکرینشات‌ها و تصاویر پیچیده را داشت اما قابلیت تحلیل زنده تصاویر را شامل نمی‌شد.

چالش‌ها: با وجود پیشرفت‌ها، Grok  هنوز در مواردی مانند تشخیص شوخی‌های کاربران (مثلاً درباره خورشیدگرفتگی) دچار خطا می‌شود. همچنین محدودیت جغرافیایی دسترسی به این سرویس در اتحادیه اروپا به دلیل قوانین جدید هوش مصنوعی این منطقه وجود دارد.

Grok Vision گامی بلند در ادغام پردازش چندوجهی (متن، صدا و تصویر) است، هرچند محدودیت‌های فنی و حقوقی چالش‌هایی برای گسترش جهانی آن ایجاد کرده است.
 

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا