سایت خبری
famaserver
  • خانه
  • عمومی
  • ورزش
  • اقتصاد
  • مسکن
  • بین الملل
  • جامعه
  • فناوری اطلاعات
سایت خبری
برترین عناوین خبری
  • خرید بیمه: سنتی یا آنلاین؟ کدامیک تجربه بهتری برای مشتریان ایجاد می‌کند؟

سرتیتر خبرها

گزارش رسانه‌های صهیونیستی از ناکامی تلاش‌ها برای تشکیل نیروی بین‌المللی در غزه

گزارش رسانه‌های صهیونیستی از ناکامی تلاش‌ها برای تشکیل نیروی بین‌المللی در غزه

5 ماه پیش
واکنش نتانیاهو به حمله استرالیا

واکنش نتانیاهو به حمله استرالیا

5 ماه پیش
حماس ترور فرمانده ارشد القسام را تایید کرد

حماس ترور فرمانده ارشد القسام را تایید کرد

5 ماه پیش
عراقچی: صلح و ثبات افغانستان تنها از مسیر همگرایی منطقه‌ای محقق می‌شود

عراقچی: صلح و ثبات افغانستان تنها از مسیر همگرایی منطقه‌ای محقق می‌شود

5 ماه پیش
غریب آبادی: مردم ایران هرگز تسلیم تهدیدات و تجاوزات نخواهند شد و متحد و منسجم در مقابل متجاوز خواهند ایستاد

غریب آبادی: مردم ایران هرگز تسلیم تهدیدات و تجاوزات نخواهند شد و متحد و منسجم در مقابل متجاوز خواهند ایستاد

5 ماه پیش
واکنش ایران به حمله خشونت آمیز در سیدنی استرالیا

واکنش ایران به حمله خشونت آمیز در سیدنی استرالیا

5 ماه پیش
مصر: همه گزینه‌ها از جمله راه‌حل نظامی را درمورد سد النهضه بررسی می‌کنیم

مصر: همه گزینه‌ها از جمله راه‌حل نظامی را درمورد سد النهضه بررسی می‌کنیم

5 ماه پیش
واکنش آمریکا به تیراندازی مرگبار در سیدنی

واکنش آمریکا به تیراندازی مرگبار در سیدنی

5 ماه پیش
رضا نصری: علی‌اکبر صالحی شایسته‌ترین گزینه نه برای مدیریت یک سفارتخانه، بلکه برای عهده‌دار شدن سمت پیشنهادی «نماینده ویژه ایران در جهان عرب» است

رضا نصری: علی‌اکبر صالحی شایسته‌ترین گزینه نه برای مدیریت یک سفارتخانه، بلکه برای عهده‌دار شدن سمت پیشنهادی «نماینده ویژه ایران در جهان عرب» است

5 ماه پیش
ادعای اوکراین درباره حملات نظامی دقیق به عمق خاک روسیه

ادعای اوکراین درباره حملات نظامی دقیق به عمق خاک روسیه

5 ماه پیش

Home » این الگوریتم جدید، زبان گوینده را تنها با مشاهده تصویر او تشخیص می‌دهد!

این الگوریتم جدید، زبان گوینده را تنها با مشاهده تصویر او تشخیص می‌دهد!

زمان انتشار: 15 ژوئن 2024 ساعت 18:50

دسته بندی: فناوری اطلاعات

شناسه خبر: 2781243

زمان مطالعه: 5 دقیقه

این الگوریتم جدید، زبان گوینده را تنها با مشاهده تصویر او تشخیص می‌دهد!

این الگوریتم جدید، زبان گوینده را تنها با مشاهده تصویر او تشخیص می‌دهد!

با ظهور این الگوریتم جدید به نام DenseAV که در آزمایشگاه هوش مصنوعی و علوم رایانه دانشگاه MIT (CSAIL) توسعه یافته است، پیشرفت چشمگیری در زمینه درک زبان انسانی صورت گرفته است.

مارک همیلتون، دانشجوی دکتری مهندسی برق و علوم رایانه در MIT و همکار این پروژه، می‌گوید: این الگوریتم با استفاده از روشی به نام یادگیری تضادی، بدون نیاز به نمونه‌های برچسب‌گذاری شده، صداها و تصاویر را با یکدیگر مقایسه می‌کند تا الگوهای مهم پیش‌بینی زبان را کشف کند.

یکی از ویژگی‌های منحصربفرد DenseAV این است که برخلاف الگوریتم‌های قبلی که صرفاً یک مفهوم شباهت بین صدا و تصویر را در نظر می‌گرفتند، این الگوریتم تمام ارتباطات ممکن بین هر ثانیه از صدا و هر پیکسل از تصویر را بررسی می‌کند. این روش ریزبینانه به DenseAV اجازه می‌دهد ارتباط دقیق‌تری بین کلمات و اشیا برقرار کند.

محققان DenseAV را روی مجموعه داده AudioSet که شامل ۲ میلیون ویدیوی یوتیوب است، آموزش دادند. آنها همچنین مجموعه داده‌های جدیدی را برای ارزیابی عملکرد الگوریتم در پیوند دادن صداها و تصاویر ایجاد کردند. در این آزمایش‌ها، DenseAV عملکرد بهتری نسبت به سایر الگوریتم‌های برتر در شناسایی اشیا از روی نام‌ها و صداها داشت.

دیوید هاروث، استاد علوم رایانه در دانشگاه تگزاس آستین که در این پروژه مشارکت نداشته است، می‌گوید: شناسایی و جداسازی اشیا بصری در تصاویر، همچنین صداهای محیطی و کلمات گفته شده در ضبط صوتی، هر کدام مسائل دشواری در حوزه خود هستند. محققان سنتی برای آموزش مدل‌های یادگیری ماشین به منظور انجام این وظایف، به برچسب‌گذاری پرهزینه انسانی متکی بوده‌اند. DenseAV پیشرفت قابل توجهی در توسعه روش‌هایی است که می‌توانند با صرفاً مشاهده جهان از طریق بینایی و شنوایی، این وظایف را به طور همزمان یاد بگیرند.

کاربردهای بالقوه این الگوریتم گسترده است. از جستجوی چندرسانه‌ای گرفته تا یادگیری زبان‌های جدید و رباتیک. محققان امیدوارند با استفاده از DenseAV بتوانند زبان‌هایی را که تاکنون از دسترس انسان‌ها دور مانده‌اند، مانند زبان دلفین‌ها و نهنگ‌ها را درک کنند.

در مجموع، DenseAV گامی بزرگ در زمینه یادگیری زبان توسط ماشین‌ها محسوب می‌شود. این الگوریتم با الهام از نحوه یادگیری کودکان، می‌تواند بدون هیچ‌گونه داده متنی از پیش آموزش دیده، معنای زبان را کشف کند. این دستاورد می‌تواند منجر به پیشرفت‌های چشمگیری در زمینه‌های مختلف از جمله جستجوی مالتی‌مدیا، یادگیری زبان‌های جدید و رباتیک شود.

 

مجله خبری سیلاد

برچسب ها
هوش مصنوعی
اشتراک گذاری

اخبار مرتبط

  • سفر دو ساعته از ژاپن به آمریکا: پایان عصر پروازهای ۱۰ ساعته؟
    سفر دو ساعته از ژاپن به آمریکا: پایان عصر پروازهای ۱۰ ساعته؟ 20 ساعت پیش
  • وقتی غول تبلیغات، سازنده محتوا می‌شود: داستان اپ‌لاوین و گیست
    وقتی غول تبلیغات، سازنده محتوا می‌شود: داستان اپ‌لاوین و گیست 20 ساعت پیش
  • گام اول بازگشت اینترنت
    گام اول بازگشت اینترنت 20 ساعت پیش
  • خداحافظی مایکروسافت با پیامک‌های تأیید؛ گامی علیه کلاهبرداری سایبری
    خداحافظی مایکروسافت با پیامک‌های تأیید؛ گامی علیه کلاهبرداری سایبری 20 ساعت پیش

دیدگاه ها

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دسته بندی موضوعات

  • استانها 15657
  • اقتصاد 11559
  • بازار مالی 2388
  • بین الملل 14490
  • تبلیغات 31
  • جامعه 10132
  • دانش 7584
  • عمومی 1926
  • فناوری اطلاعات 7893
  • فیلم 3546
  • کاریکاتور 519
  • مسکن 1767
  • ورزش 23778

جدیدترین مقالات

  • کمک ۳۰۰ میلیاردی وزارت ورزش به فدراسیون فوتبال
    کمک ۳۰۰ میلیاردی وزارت ورزش به فدراسیون فوتبال 10 ساعت پیش
  • ساماندهی پسماند آمل باید به نتیجه نهایی برسد
    ساماندهی پسماند آمل باید به نتیجه نهایی برسد 10 ساعت پیش
  • پایان نبرد شبانه با حادثه در خط انتقال آب چالوس
    پایان نبرد شبانه با حادثه در خط انتقال آب چالوس 10 ساعت پیش
  • توافق 100 مگاواتی دانشگاه علوم پزشکی استان سمنان با بخش خصوصی
    توافق 100 مگاواتی دانشگاه علوم پزشکی استان سمنان با بخش خصوصی 10 ساعت پیش
  • ترافیک سنگین در جاده‌های ورودی استان مازندران
    ترافیک سنگین در جاده‌های ورودی استان مازندران 10 ساعت پیش

لینکهای پیشنهادی

سرور مجازی |  دانلود رایگان نرم افزار |  کلاس آنلاین

میزبانی در هاست ویندوز فاماسرور