سایت خبری
famaserver
  • خانه
  • عمومی
  • ورزش
  • اقتصاد
  • مسکن
  • بین الملل
  • جامعه
  • فناوری اطلاعات
سایت خبری

سرتیتر خبرها

المیادین: جنگ علیه ایران… قماری که شکست‌ خورد

المیادین: جنگ علیه ایران… قماری که شکست‌ خورد

14 ساعت پیش
کابل: هر حمله خارجی پاسخی درس‌آموز در پی خواهد داشت

کابل: هر حمله خارجی پاسخی درس‌آموز در پی خواهد داشت

14 ساعت پیش
دستور نتانیاهو برای حملات شدید و فوری به نوار غزه

دستور نتانیاهو برای حملات شدید و فوری به نوار غزه

14 ساعت پیش

ببینید | ساسان کریمی: اینکه بگوییم با ترامپ هیچکاری نمی‌شود کرد، بدترین ایده است

14 ساعت پیش
تاکید ایران بر پایان محاصره بدون قید و شرط کوبا

تاکید ایران بر پایان محاصره بدون قید و شرط کوبا

14 ساعت پیش
عضو حماس: پنهان کردن اجساد اسرای صهیونیست سودی برای مقاومت ندارد

عضو حماس: پنهان کردن اجساد اسرای صهیونیست سودی برای مقاومت ندارد

14 ساعت پیش
همسر مکرون و حاشیه‌های جنسیت او

همسر مکرون و حاشیه‌های جنسیت او

14 ساعت پیش
نتانیاهو آمریکا را در جریان تجاوز به غزه قرار داد

نتانیاهو آمریکا را در جریان تجاوز به غزه قرار داد

14 ساعت پیش
مقام آمریکایی: حماس توافق را نقض نکرده است

مقام آمریکایی: حماس توافق را نقض نکرده است

14 ساعت پیش
رئیس‌جمهور کلمبیا: آمریکا با حملاتش مردم را ترور می‌کند

رئیس‌جمهور کلمبیا: آمریکا با حملاتش مردم را ترور می‌کند

14 ساعت پیش

Home » آموزش بدون مجوز مدل‌های هوش مصنوعی از رونوشت‌های متنی یوتیوب توسط غول‌های فناوری

آموزش بدون مجوز مدل‌های هوش مصنوعی از رونوشت‌های متنی یوتیوب توسط غول‌های فناوری

زمان انتشار: 19 جولای 2024 ساعت 18:50

دسته بندی: فناوری اطلاعات

شناسه خبر: 2795318

زمان مطالعه: 6 دقیقه

آموزش بدون مجوز مدل‌های هوش مصنوعی از رونوشت‌های متنی یوتیوب توسط غول‌های فناوری

آموزش بدون مجوز مدل‌های هوش مصنوعی از رونوشت‌های متنی یوتیوب توسط غول‌های فناوری

تحقیقات جدید وبسایت Proof News نشان می‌دهد که برخی از بزرگترین شرکت‌های فناوری جهان مدل‌های هوش مصنوعی خود را بر روی دیتاستی، که شامل رونوشت‌های بیش از 173000 ویدیوی یوتیوب بود، بدون مجوز آموزش داده‌اند.
 
به گزارش سیلاد و به نقل از انگجت، این دیتاست که توسط یک شرکت غیرانتفاعی به نام EleutherAI ایجاد شده است، حاوی رونوشت‌هایی از ویدئوهای یوتیوب از بیش از 48000 کانال است، و از جمله توسط اپل، انویدیا و آنتروپیک استفاده شده است. یافته‌های این تحقیقات واقعیت ناراحت‌کننده‌ای را درباره هوش مصنوعی روشن می‌کند: این فناوری عمدتاً بر پایه داده‌هایی ساخته شده است که از تولیدکنندگان محتوا بدون کسب رضایت یا پرداخت غرامت به آنها استخراج شده است.
 
این دیتاست شامل هیچ ویدیو یا تصویری از یوتیوب نیست، اما شامل رونوشت‌های ویدیویی از بزرگترین تولیدکنندگان محتوا در این پلتفرم از جمله مارکز براونلی و MrBeast، و همچنین ناشران بزرگ خبری مانند نیویورک‌تایمز، بی‌بی‌سی و ABC News است. زیرنویس‌های ویدیوهای متعلق به انگجت نیز بخشی از این دیتاست است.
 
براونلی در اکانت خود در ایکس اینگونه نوشت: «اپل داده‌های هوش مصنوعی خود را از چندین شرکت تهیه کرده است.» او افزود: «یکی از آنها هزاران دیتا/رونوشت را از ویدیوهای یوتیوب، از جمله مال من، جمع‌آوری کرده است. وی افزود: «این یک مشکل رو به گسترش برای مدتی طولانی خواهد بود».
 

آموزش بدون مجوز مدل‌های هوش مصنوعی از رونوشت‌های متنی یوتیوب توسط غول‌های فناوری

یکی از سخنگویان گوگل در پاسخ گفت که نظرات قبلی توسط نیل موهان، مدیرعامل یوتیوب، مبنی بر اینکه شرکت‌هایی که به شکلی از داده‌های یوتیوب برای آموزش مدل‌های هوش مصنوعی استفاده می‌کنند که شرایط و خدمات این پلت‌فرم را نقض می‌کند همچنان پابرجاست. اپل، انویدیا، آنتروپیک و EleutherAI به درخواست اظهار نظر از طرف انگجت پاسخ ندادند.
 
تاکنون، شرکت‌های هوش مصنوعی درباره داده‌های مورد استفاده برای آموزش مدل‌های خود شفاف نبوده‌اند. در اوایل این ماه، هنرمندان و عکاسان اپل را به دلیل فاش نکردن منبع داده‌های آموزشی برای Apple Intelligence مورد انتقاد قرار دادند.
 
یوتیوب، به طور ویژه به عنوان بزرگترین مخزن ویدیوهای جهان، معدن طلایی نه تنها رونوشت (ترانسکریپت)، بلکه صدا، ویدئو و تصاویر است که آن را به دیتاستی جذاب برای آموزش مدل‌های هوش مصنوعی تبدیل می‌کند. در اوایل سال جاری، میرا موراتی، مدیر ارشد فناوری OpenAI، از پاسخ دادن به سؤالات وال‌استریت‌ژورنال در مورد اینکه آیا این شرکت از ویدیوهای یوتیوب برای آموزش سورا (ابزار تولید ویدیوی هوش مصنوعی آتی OpenAI) استفاده می‌کند طفره رفت.

موراتی در آن زمان گفت: «من قصد ندارم وارد جزئیات داده‌هایی که استفاده شده‌اند بشوم، اما این داده‌ها در دسترس عموم بوده یا داده‌های دارای مجوز بوده‌اند». ساندار پیچای، مدیرعامل آلفابت، نیز گفته است که شرکت‌هایی که از داده‌های یوتیوب برای آموزش مدل‌های هوش مصنوعی خود استفاده می‌کنند شرایط خدمات این پلتفرم را نقض می‌کنند.
 
اگر می‌خواهید ببینید زیرنویس‌های ویدیوهای یوتیوب شما یا کانال‌های مورد علاقه‌تان بخشی از این دیتاست هستند یا نه، می‌توانید به ابزار جستجوی Proof News مراجعه کنید.

مجله خبری سیلاد

برچسب ها
هوش مصنوعی
اشتراک گذاری

اخبار مرتبط

  • اپل زیر فشار اروپا؛ احتمال خاموشی App Tracking Transparency در قاره سبز
    اپل زیر فشار اروپا؛ احتمال خاموشی App Tracking Transparency در قاره سبز 15 ساعت پیش
  • جدیدترین قیمت رمزارزها
    جدیدترین قیمت رمزارزها 15 ساعت پیش
  • تراشه «مغز مایکروویو» کرنل، انقلابی در محاسبات و هوش مصنوعی
    تراشه «مغز مایکروویو» کرنل، انقلابی در محاسبات و هوش مصنوعی 15 ساعت پیش
  • رمزگشایی از یک نقل‌قول جنجالی: هشدار بیل گیتس را جدی بگیریم؟
    رمزگشایی از یک نقل‌قول جنجالی: هشدار بیل گیتس را جدی بگیریم؟ 15 ساعت پیش

دیدگاه ها

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دسته بندی موضوعات

  • استانها 7499
  • اقتصاد 6762
  • بازار مالی 1491
  • بین الملل 12970
  • تبلیغات 27
  • جامعه 7753
  • دانش 5594
  • عمومی 1926
  • فناوری اطلاعات 6857
  • فیلم 3546
  • کاریکاتور 519
  • مسکن 1026
  • ورزش 19344

جدیدترین مقالات

  • اولین هنرستان تخصصی‌ جوار صنعت استان کرمانشاه افتتاح شد
    اولین هنرستان تخصصی‌ جوار صنعت استان کرمانشاه افتتاح شد 5 ساعت پیش
  • ۲۶۰۰ هکتار از اراضی جنگلی کرمانشاه دچار آتش‌سوزی شده است
    ۲۶۰۰ هکتار از اراضی جنگلی کرمانشاه دچار آتش‌سوزی شده است 5 ساعت پیش
  • مطالبات ذرت‌کاران پارس‌آباد تا یک ماه آینده پرداخت می‌شود
    مطالبات ذرت‌کاران پارس‌آباد تا یک ماه آینده پرداخت می‌شود 5 ساعت پیش
  • سهمیه ارزی مرزنشینان، فرصتی طلایی برای تقویت اقتصاد خراسان شمالی
    سهمیه ارزی مرزنشینان، فرصتی طلایی برای تقویت اقتصاد خراسان شمالی 5 ساعت پیش
  • استاندار قزوین از سه واحد تولیدی در تاکستان بازدید کرد
    استاندار قزوین از سه واحد تولیدی در تاکستان بازدید کرد 5 ساعت پیش

لینکهای پیشنهادی

سرور مجازی |  دانلود رایگان نرم افزار | تجهیزات آزمایشگاهی | کلاس آنلاین

میزبانی در هاست ویندوز فاماسرور