به گزارش خبرآنلاین، دیپسیک که اخیراً در دنیای هوش مصنوعی جنجال بهپا کرد، با اتهام استفاده از دادههای بدون مجوز مواجه شده است. OpenAI ادعا میکند شواهدی در اختیار دارد که نشان میدهد دیپسیک از مدلهای OpenAI برای آموزش مدل خود بهره برده است. در صورت اثبات، دیپسیک قوانین OpenAI را نقض کرده است.
به نقل از زومیت، OpenAI به فایننشال تایمز اعلام کرد دیپسیک از روش استخراج دانش (Distillation) استفاده کرده است؛ روشی که خروجیهای یک مدلِ از پیش آموزشدیده را برای آموزش مدل جدید بهکار میگیرد. این روش هزینهی توسعهی مدلهای جدید را کاهش میدهد و دیپسیک ادعا دارد که مدل R1 خود را با هزینهای بهمراتب کمتر توسعه داده است. البته اگر این مدل بر پایهی استخراج دانش از OpenAI ساخته شده باشد، ادعای هزینهی کمتر آن زیر سؤال میرود.
استفاده از روش استخراج دانش قانونی است، اما در این مورد، دیپسیک به نقض شرایط استفاده از خدمات OpenAI متهم شده است. طبق قوانین این شرکت، کاربران نمیتوانند از API آن برای کپی کردن خدماتش یا توسعهی مدلهای رقابتی استفاده کنند.
بر اساس گزارش فایننشال تایمز، OpenAI و مایکروسافت حسابهایی را شناسایی و سال گذشته مسدود کردند که احتمال داده میشود متعلق به دیپسیک بودهاند و برای استخراج دانش از مدلهای OpenAI استفاده شدهاند.
OpenAI در بیانیهای اعلام کرد که شرکتهای مستقر در چین و دیگر کشورها بهطور مداوم در تلاشند مدلهای شرکتهای پیشرو آمریکایی را استخراج کنند. این شرکت همچنین بر اهمیت همکاری با دولت ایالات متحده برای محافظت از فناوریهای پیشرفته تأکید کرد.
دیوید ساکس، مشاور کاخ سفید در حوزهی هوش مصنوعی نیز اظهار داشت شواهد معتبری وجود دارد که میگویند دیپسیک از اطلاعات مدلهای OpenAI بهره برده است.
نکتهی طعنهآمیز این است که OpenAI خود بارها به استفادهی بدون مجوز از دادهها برای آموزش مدلهایش متهم شده است. در دسامبر 2023 (آذر 1402)، نیویورک تایمز از OpenAI شکایت کرد و مدعی شد که استفادهی این شرکت از دادههایش تحت مفهوم استفادهی منصفانه قرار نمیگیرد. در ادامه، رسانههای دیگر نیز شکایتهایی مشابه مطرح کردند.
بااینحال، اگرچه OpenAI خود با چنین اتهاماتی مواجه بوده، این مسئله رفتار دیپسیک را توجیه نمیکند. در نهایت، OpenAI قوانین روشنی برای ممنوعیت استفادهی رقابتی از مدلهایش دارد، اما مطرح کردن این اتهام از سوی شرکتی که خود متهم به نقض حقوق داده است، قابلتأمل به نظر میرسد.
5858