فناوری اطلاعات

همه‌چیز درباره DeepSeek: چطور یک استارتاپ چینی در کمتر از یک سال جهانی شد؟

همه‌چیز درباره DeepSeek: چطور یک استارتاپ چینی در کمتر از یک سال جهانی شد؟

آزمایشگاه هوش مصنوعی چینی «دیپ‌سیک» این هفته پس از آن‌که اپلیکیشن چت‌بات آن به صدر فهرست محبوب‌ترین برنامه‌ها در فروشگاه‌های اپ‌استور اپل و گوگل‌پلی رسید، توجه بسیاری را به خود جلب کرد. مدل‌های هوش مصنوعی این شرکت که با بهره‌گیری از روش‌های محاسباتی پیشرفته آموزش دیده‌اند، موجب شده‌اند تحلیل‌گران وال‌استریت و کارشناسان حوزه فناوری به این پرسش بیندیشند که آیا ایالات متحده قادر خواهد بود برتری خود را در رقابت جهانی هوش مصنوعی حفظ کند و آیا تقاضا برای تراشه‌های هوش مصنوعی همچنان پایدار خواهد ماند یا خیر.

اما دیپ‌سیک چگونه پدید آمد و چطور توانست در مدت‌زمانی کوتاه به شهرت جهانی دست یابد؟

خاستگاه مالی دیپ‌سیک

دیپ‌سیک از سوی شرکت مدیریت سرمایه High-Flyer، یک صندوق پوشش ریسک کمی در چین که در تصمیم‌گیری‌های تجاری از هوش مصنوعی استفاده می‌کند، پشتیبانی می‌شود.

بنیان‌گذار این صندوق، لیانگ ونفنگ، فردی علاقه‌مند به هوش مصنوعی است که در سال ۲۰۱۵ شرکت High-Flyer را تأسیس کرد. ونفنگ که از دوران دانشجویی در دانشگاه ژجیانگ وارد عرصه معاملات شده بود، در سال ۲۰۱۹ شرکت High-Flyer Capital Management را با تمرکز بر توسعه و استقرار الگوریتم‌های هوش مصنوعی بنیان نهاد.

در سال ۲۰۲۳، این شرکت، دیپ‌سیک را به‌عنوان آزمایشگاهی مستقل برای تحقیق و توسعه ابزارهای هوش مصنوعی و جدا از فعالیت‌های مالی خود راه‌اندازی کرد. با حمایت High-Flyer، دیپ‌سیک به نهادی مستقل تحت همین نام تبدیل شد.

از همان آغاز، دیپ‌سیک اقدام به راه‌اندازی خوشه‌های اختصاصی مراکز داده جهت آموزش مدل‌های خود کرد. با این حال، مانند سایر شرکت‌های چینی فعال در این حوزه، با محدودیت‌های صادرات تجهیزات از سوی ایالات متحده مواجه شده است. به همین دلیل، برای آموزش یکی از مدل‌های جدید خود، این شرکت ناگزیر به استفاده از تراشه‌های Nvidia H800 – نسخه‌ای ضعیف‌تر از H100 که برای شرکت‌های آمریکایی در دسترس است – شد.

گفته می‌شود که تیم فنی دیپ‌سیک متشکل از نیروهای جوان است و این شرکت به‌طور روزافزون در حال جذب پژوهشگران دارای مدرک دکتری در حوزه هوش مصنوعی از دانشگاه‌های معتبر چین است. به گزارش نیویورک تایمز، دیپ‌سیک همچنین افرادی بدون پیشینه رسمی در علوم رایانه را استخدام می‌کند تا درک عمیق‌تری از طیف وسیعی از موضوعات انسانی در مدل‌های خود ایجاد کند.

 

همه‌چیز درباره DeepSeek: چطور یک استارتاپ چینی در کمتر از یک سال جهانی شد؟

 

مدل‌های قدرتمند دیپ‌سیک

نخستین مجموعه مدل‌های دیپ‌سیک، شامل «دیپ‌سیک کدر»، «دیپ‌سیک ال‌ال‌ام» و «دیپ‌سیک چت» در آبان ۱۴۰۲ معرفی شد، اما توجه جامعه فناوری زمانی جلب شد که این استارتاپ نسل دوم مدل‌های خود موسوم به «دیپ‌سیک وی۲» را در بهار گذشته عرضه کرد.

مدل DeepSeek-V2 که قابلیت تحلیل متن و تصویر را به‌طور هم‌زمان دارد، در ارزیابی‌های مختلف عملکرد موفقی از خود نشان داد و با هزینه‌ای به‌مراتب پایین‌تر از مدل‌های مشابه، به بازار عرضه شد. این دستاورد، شرکت‌های رقیب چینی مانند ByteDance و Alibaba را وادار کرد که قیمت‌گذاری خدمات خود را کاهش دهند یا حتی برخی از مدل‌ها را به‌صورت رایگان ارائه دهند.

مدل DeepSeek-V3 که در آذر ۱۴۰۳ عرضه شد، شهرت دیپ‌سیک را بیش از پیش گسترش داد.

بر اساس نتایج ارزیابی داخلی این شرکت، مدل V3 عملکردی بهتر از مدل‌های قابل‌دانلود و عمومی مانند Llama از شرکت Meta، و حتی مدل‌های «بسته» مانند GPT-4o از OpenAI که تنها از طریق API قابل‌استفاده هستند، از خود نشان داده است.

مدل «استدلالی» R1، که در دی‌ماه عرضه شد، نیز به همان اندازه قابل‌توجه است. دیپ‌سیک مدعی است که R1 از نظر دقت در برخی معیارهای کلیدی، با مدل o1 شرکت OpenAI رقابت می‌کند.

ویژگی بارز مدل‌های استدلالی مانند R1 توانایی بررسی و ارزیابی پاسخ‌های تولیدشده توسط خودشان است؛ قابلیتی که از بروز برخی خطاهای رایج در مدل‌های زبانی جلوگیری می‌کند. هرچند تولید پاسخ در این مدل‌ها چند ثانیه تا چند دقیقه بیشتر طول می‌کشد، اما در حوزه‌هایی نظیر فیزیک، علوم و ریاضیات، به‌مراتب قابل اعتمادتر هستند.

با این حال، دیپ‌سیک V3، R1 و دیگر مدل‌های این شرکت با محدودیتی مواجه‌اند. چون این مدل‌ها در چین توسعه یافته‌اند، باید توسط نهادهای نظارتی آن کشور بررسی شوند تا اطمینان حاصل شود که محتوای آن‌ها با «ارزش‌های بنیادی سوسیالیستی» مطابقت دارد. برای نمونه، مدل R1 در اپلیکیشن چت‌بات دیپ‌سیک به پرسش‌هایی درباره میدان تیان‌آن‌من یا استقلال تایوان پاسخ نمی‌دهد.

تا اسفندماه گذشته، دیپ‌سیک از مرز ۱۶.۵ میلیون بازدید عبور کرد. دیوید کار، سردبیر Similarweb، در گفت‌وگو با TechCrunch اعلام کرد که علی‌رغم کاهش ۲۵ درصدی ترافیک نسبت به بهمن‌ماه، دیپ‌سیک از نظر بازدید روزانه در رتبه دوم قرار دارد. البته این رقم در مقایسه با ChatGPT که در اسفند از ۵۰۰ میلیون کاربر فعال هفتگی عبور کرد، همچنان ناچیز به نظر می‌رسد.

 

همه‌چیز درباره DeepSeek: چطور یک استارتاپ چینی در کمتر از یک سال جهانی شد؟

 

رویکردی مختل‌کننده اما مبهم

مدل کسب‌وکار دیپ‌سیک چندان شفاف نیست. این شرکت محصولات خود را با قیمتی بسیار پایین‌تر از ارزش بازار عرضه می‌کند و حتی برخی از خدمات را رایگان در اختیار عموم قرار داده است. با وجود استقبال گسترده سرمایه‌گذاران خطرپذیر، دیپ‌سیک تا کنون هیچ سرمایه‌گذاری مالی رسمی دریافت نکرده است.

به ادعای این شرکت، دستاوردهای قابل‌توجه در بهره‌وری موجب شده که توان رقابتی آن در هزینه‌ها افزایش یابد. با این حال، برخی از کارشناسان در مورد صحت این ارقام ابراز تردید کرده‌اند.

با این وجود، توسعه‌دهندگان زیادی به استفاده از مدل‌های دیپ‌سیک روی آورده‌اند. هرچند این مدل‌ها به‌صورت متن‌باز کامل ارائه نمی‌شوند، اما تحت مجوزهای مجاز برای استفاده تجاری در دسترس هستند. به گفته کلم دلانگو، مدیرعامل پلتفرم Hugging Face، تا کنون بیش از ۵۰۰ مدل مشتق‌شده از R1 بر روی این پلتفرم بارگذاری شده و در مجموع ۲.۵ میلیون بار دانلود شده‌اند.

برخی از تحلیل‌گران موفقیت دیپ‌سیک را نشانه‌ای از «تحول در حوزه هوش مصنوعی» می‌دانند و برخی دیگر آن را «اغراق‌شده» توصیف می‌کنند. در هر حال، گفته می‌شود که ظهور این شرکت، دست‌کم تا حدودی در کاهش ۱۸ درصدی قیمت سهام انویدیا در دی‌ماه و واکنش‌های علنی سم آلتمن، مدیرعامل OpenAI، نقش داشته است. طبق گزارش رویترز، وزارت بازرگانی ایالات متحده در اسفندماه به کارکنان خود اعلام کرده که استفاده از دیپ‌سیک در دستگاه‌های دولتی ممنوع است.

مایکروسافت اعلام کرده که دیپ‌سیک از طریق پلتفرم Azure AI Foundry در دسترس قرار دارد. در جریان نشست گزارش مالی سه‌ماهه نخست، مارک زاکربرگ در پاسخ به پرسشی درباره تأثیر دیپ‌سیک بر هزینه‌های هوش مصنوعی شرکت Meta، تأکید کرد که سرمایه‌گذاری در زیرساخت‌های هوش مصنوعی همچنان یک مزیت راهبردی برای این شرکت محسوب می‌شود. از سوی دیگر، OpenAI در اسفندماه دیپ‌سیک را نهادی «تحت حمایت و کنترل دولت چین» توصیف کرد و پیشنهاد داد که دولت ایالات متحده ممنوعیت استفاده از مدل‌های آن را در نظر بگیرد.

در همین حال، جنسن هوانگ، مدیرعامل انویدیا، در گزارش مالی سه‌ماهه چهارم این شرکت، نوآوری‌های دیپ‌سیک را تحسین کرد و مدل‌های استدلالی این شرکت را فرصت مناسبی برای انویدیا دانست، چراکه نیازمند توان پردازشی بیشتری هستند.

در همین زمان، برخی کشورها و شرکت‌ها – از جمله کره جنوبی و ایالت نیویورک – استفاده از دیپ‌سیک را در نهادهای دولتی ممنوع کرده‌اند.

در اردیبهشت‌ماه، برد اسمیت، نایب‌رئیس و رئیس شرکت مایکروسافت، در جلسه استماع سنا اعلام کرد که به دلایل امنیتی و نگرانی‌های تبلیغاتی، استفاده از دیپ‌سیک برای کارکنان این شرکت مجاز نیست.

 

همه‌چیز درباره DeepSeek: چطور یک استارتاپ چینی در کمتر از یک سال جهانی شد؟

 

آینده‌ای نامشخص اما چالش‌برانگیز

آینده دیپ‌سیک همچنان در هاله‌ای از ابهام قرار دارد. توسعه و ارتقای مدل‌های این شرکت، امری بدیهی و ادامه‌دار است؛ اما با توجه به نگرانی‌های فزاینده ایالات متحده درباره نفوذ خارجی، چشم‌انداز دیپ‌سیک در سطح جهانی با چالش‌هایی جدی همراه خواهد بود. طبق گزارش وال‌استریت ژورنال، ایالات متحده احتمال می‌دهد استفاده از دیپ‌سیک در تمام دستگاه‌های دولتی را ممنوع اعلام کند.

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا