سایت خبری
famaserver
  • خانه
  • عمومی
  • ورزش
  • اقتصاد
  • مسکن
  • بین الملل
  • جامعه
  • فناوری اطلاعات
سایت خبری
برترین عناوین خبری
  • خرید بیمه: سنتی یا آنلاین؟ کدامیک تجربه بهتری برای مشتریان ایجاد می‌کند؟

سرتیتر خبرها

گزارش رسانه‌های صهیونیستی از ناکامی تلاش‌ها برای تشکیل نیروی بین‌المللی در غزه

گزارش رسانه‌های صهیونیستی از ناکامی تلاش‌ها برای تشکیل نیروی بین‌المللی در غزه

6 ماه پیش
واکنش نتانیاهو به حمله استرالیا

واکنش نتانیاهو به حمله استرالیا

6 ماه پیش
حماس ترور فرمانده ارشد القسام را تایید کرد

حماس ترور فرمانده ارشد القسام را تایید کرد

6 ماه پیش
عراقچی: صلح و ثبات افغانستان تنها از مسیر همگرایی منطقه‌ای محقق می‌شود

عراقچی: صلح و ثبات افغانستان تنها از مسیر همگرایی منطقه‌ای محقق می‌شود

6 ماه پیش
غریب آبادی: مردم ایران هرگز تسلیم تهدیدات و تجاوزات نخواهند شد و متحد و منسجم در مقابل متجاوز خواهند ایستاد

غریب آبادی: مردم ایران هرگز تسلیم تهدیدات و تجاوزات نخواهند شد و متحد و منسجم در مقابل متجاوز خواهند ایستاد

6 ماه پیش
واکنش ایران به حمله خشونت آمیز در سیدنی استرالیا

واکنش ایران به حمله خشونت آمیز در سیدنی استرالیا

6 ماه پیش
مصر: همه گزینه‌ها از جمله راه‌حل نظامی را درمورد سد النهضه بررسی می‌کنیم

مصر: همه گزینه‌ها از جمله راه‌حل نظامی را درمورد سد النهضه بررسی می‌کنیم

6 ماه پیش
واکنش آمریکا به تیراندازی مرگبار در سیدنی

واکنش آمریکا به تیراندازی مرگبار در سیدنی

6 ماه پیش
رضا نصری: علی‌اکبر صالحی شایسته‌ترین گزینه نه برای مدیریت یک سفارتخانه، بلکه برای عهده‌دار شدن سمت پیشنهادی «نماینده ویژه ایران در جهان عرب» است

رضا نصری: علی‌اکبر صالحی شایسته‌ترین گزینه نه برای مدیریت یک سفارتخانه، بلکه برای عهده‌دار شدن سمت پیشنهادی «نماینده ویژه ایران در جهان عرب» است

6 ماه پیش
ادعای اوکراین درباره حملات نظامی دقیق به عمق خاک روسیه

ادعای اوکراین درباره حملات نظامی دقیق به عمق خاک روسیه

6 ماه پیش

Home » دو روش جدید، سدهای ایمنی هوش مصنوعی را در هم شکستند

دو روش جدید، سدهای ایمنی هوش مصنوعی را در هم شکستند

زمان انتشار: 29 آوریل 2025 ساعت 13:34

دسته بندی: فناوری اطلاعات

شناسه خبر: 2818693

زمان مطالعه: 4 دقیقه

دو روش جدید، سدهای ایمنی هوش مصنوعی را در هم شکستند

دو روش جدید، سدهای ایمنی هوش مصنوعی را در هم شکستند

دو روش جدید برای دور زدن محدودیت‌های ایمنی مدل‌های زبانی بزرگ (LLM) کشف شده که تهدیدی سیستماتیک برای پرکاربردترین پلتفرم‌های هوش مصنوعی مانند ChatGPT، جمینای، کوپایلوت، کلاود، DeepSeek، گراک، MetaAI و MistralAI ایجاد کرده است.

به گزارش سیلاد و به نقل از سایبرسیکیوریتی‌نیوز، روش نخست به نام Inception، با استفاده از سناریوهای خیالی تو در تو، مرزهای اخلاقی مدل را تضعیف کرده و آن را به تولید محتوای ممنوعه هدایت می‌کند. روش دوم، مدل را وادار می‌کند تا توضیح دهد چگونه نباید پاسخ دهد، تا از این اطلاعات برای هدایت مدل موردنظر به سمت تولید محتوای غیرمجاز استفاده می‌کند. هر دو روش به دلیل توانایی مدل‌های زبانی در حفظ زمینه (context) و تمایل به کمک‌رسانی، موفق می‌شوند سیستم‌های فیلترینگ را دور بزنند.

این آسیب‌پذیری‌ها امکان تولید محتواهای خطرناک مانند دستورالعمل‌های ساخت سلاح، بدافزارها، فیشینگ و سایر فعالیت‌های غیرقانونی را فراهم می‌کند. هرچند شدت هر مورد ممکن است کم به نظر برسد، اما به دلیل ابعاد سیستماتیک تهدید، خطر آن بسیار بالا ارزیابی می‌شود و می‌تواند زمینه‌ساز سوءاستفاده‌های گسترده شود.
 

دو روش جدید، سدهای ایمنی هوش مصنوعی را در هم شکستند
با توجه به وابستگی روزافزون صنایع به هوش مصنوعی، از خدمات مشتریان گرفته تا سلامت و امور مالی، پیامدهای یک حمله موفق می‌تواند بسیار مخرب باشد. واکنش اولیه برخی شرکت‌ها، مانند دیپ‌سیک، شامل تایید وجود مشکل و تاکید بر بهبود مستمر تدابیر امنیتی بوده است. سایر شرکت‌ها هنوز موضع رسمی خود را اعلام نکرده‌اند.

کارشناسان هشدار می‌دهند که تکنیک‌های جدیدی چون «تزریق شخصیت» و فرار از یادگیری ماشین خصمانه در حال پیچیده‌تر کردن فضای امنیتی هستند. در نهایت، کشف این روش‌ها بر لزوم توسعه راهکارهای دفاعی پویا و مقاوم‌تر در برابر حملات تاکید دارد، چراکه رقابت میان توسعه‌دهندگان و مهاجمان در حوزه هوش مصنوعی روزبه‌روز شدیدتر می‌شود.

برچسب ها
حمله Inception
اشتراک گذاری

اخبار مرتبط

  • ترفندهای مخفی کوپایلوت برای افزایش بهره‌وری
    ترفندهای مخفی کوپایلوت برای افزایش بهره‌وری 4 ساعت پیش
  • پشت پرده درآمد میلیاردی خانواده ترامپ از ارزهای دیجیتال
    پشت پرده درآمد میلیاردی خانواده ترامپ از ارزهای دیجیتال 4 ساعت پیش
  • آنتروپیک از Claude Fable 5 رونمایی کرد؛ جهش بزرگ در کدنویسی AI
    آنتروپیک از Claude Fable 5 رونمایی کرد؛ جهش بزرگ در کدنویسی AI 4 ساعت پیش
  • اپل از نقش واقعی گوگل در ساخت سیری جدید پرده برداشت
    اپل از نقش واقعی گوگل در ساخت سیری جدید پرده برداشت 4 ساعت پیش

دیدگاه ها

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دسته بندی موضوعات

  • استانها 16345
  • اقتصاد 11931
  • بازار مالی 2471
  • بین الملل 14490
  • تبلیغات 31
  • جامعه 10132
  • دانش 7584
  • عمومی 1926
  • فناوری اطلاعات 7992
  • فیلم 3546
  • کاریکاتور 519
  • مسکن 1924
  • ورزش 23778

جدیدترین مقالات

  • سد سرابی سریز کرد
    سد سرابی سریز کرد 8 ساعت پیش
  • مشهد برای تدفین رهبر شهید آماده است
    مشهد برای تدفین رهبر شهید آماده است 8 ساعت پیش
  • توسعه  پایدار بخش معادن نیازمند استفاده حداکثری از توان تخصصی مهندسین است
    توسعه پایدار بخش معادن نیازمند استفاده حداکثری از توان تخصصی مهندسین است 8 ساعت پیش
  • نقش بانک ملی در توسعه زیرساخت‌های اقتصادی کرمان/ هم‌اندیشی نمایندگان مجلس و مدیران بانکی
    نقش بانک ملی در توسعه زیرساخت‌های اقتصادی کرمان/ هم‌اندیشی نمایندگان مجلس و مدیران بانکی 8 ساعت پیش
  • سهمیه سوخت صنایع و معادن قزوین افزایش یافت
    سهمیه سوخت صنایع و معادن قزوین افزایش یافت 8 ساعت پیش

لینکهای پیشنهادی

سرور مجازی |  دانلود رایگان نرم افزار |  کلاس آنلاین

میزبانی در هاست ویندوز فاماسرور