هزینه ۱ میلیارد دلاری برای آموزش هوش مصنوعی DeepSeek فاش شد
تحقیقات جدید نشان میدهد که هزینه آموزش DeepSeek V3 بهجای ۶ میلیون دلار ادعاشده، در واقع ۱.۳ میلیارد دلار بوده است. گزارش اخیر SemiAnalysis این موضوع را بررسی کرده و نشان داده که برآوردهای اولیه، بسیاری از هزینههای کلیدی از جمله تحقیق و توسعه، زیرساختها و هزینههای نگهداری GPU را در نظر نگرفتهاند.
طبق این گزارش، بخش عمدهای از این هزینهها صرف خوشههای GPU شده که نیروی پردازشی اصلی DeepSeek را تأمین میکنند.
بررسی منابع GPU هوش مصنوعی DeepSeek
برخی گزارشها اشاره کردهاند که DeepSeek به ۵۰,۰۰۰ GPU Hopper دسترسی دارد، اما SemiAnalysis روشن کرده که این مقدار شامل مدلهای متنوعی از GPU مانند H800، H100 و H20 است که مخصوص بازارهای خاص طراحی شدهاند. این موضوع بر استراتژی تأمین منابع و بهرهوری عملیاتی این شرکت تأثیر قابلتوجهی دارد.
ساختار سازمانی DeepSeek و افزایش سرعت عملیات
یکی از مزیتهای DeepSeek در مدیریت مراکز داده اختصاصی آن است. برخلاف بسیاری از آزمایشگاههای هوش مصنوعی که به تأمینکنندگان ابری وابسته هستند، DeepSeek توانسته با مدل ساده و چابک خود، سرعت توسعه را افزایش دهد.
مقایسه DeepSeek با OpenAI و رقبا
گزارش نشان میدهد که مدل R1 DeepSeek در استدلالهای منطقی با مدل o1 OpenAI قابل مقایسه است، اما نمیتوان آن را پیشتاز بیچون و چرای این حوزه دانست.
در حالی که DeepSeek قیمتگذاری جذابی ارائه کرده است، اما مدلهایی مانند Gemini Flash 2.0 گوگل API مقرونبهصرفهتری ارائه میدهند. این مسأله، چالشی برای DeepSeek ایجاد کرده تا تعادلی بین عملکرد و هزینه برقرار کند.
نوآوری DeepSeek در کاهش هزینهها با فناوری MLA
DeepSeek با استفاده از فناوری توجه پنهانی چندوجهی (MLA) توانسته هزینههای پردازشی را به میزان ۹۳.۳٪ کاهش دهد. این پیشرفت، گامی مهم برای بهصرفهتر کردن مدلهای هوش مصنوعی محسوب میشود.
چالشهای صادراتی و محدودیتهای DeepSeek
در حالی که DeepSeek به دلیل چابکی در عملیات و کاهش هزینهها برتریهایی دارد، اما با چالشهای صادراتی ایالات متحده مواجه است. محدودیتهای صادرات سختافزارهای پیشرفته ممکن است بر مقیاسپذیری عملیات آن تأثیر بگذارد.
جمعبندی: جایگاه DeepSeek در رقابت هوش مصنوعی
بررسیهای SemiAnalysis نشان میدهد که DeepSeek در حال تبدیل شدن به یک بازیگر مهم در صنعت هوش مصنوعی است. با این حال، برای حفظ موقعیت خود باید بین عملکرد، هزینهها و محدودیتهای بینالمللی تعادل ایجاد کند.
پاسخ DeepSeek درباره هزینه آموزش خود:
“هزینه دقیق آموزش مدلی مانند من بهصورت عمومی منتشر نشده است، اما برآوردها نشان میدهد که هزینه آموزش مدلهای زبانی بزرگ، شامل منابع پردازشی، برق، جمعآوری دادهها و تلاشهای مهندسی، میتواند به میلیونها دلار برسد.”