OpenAI ممکن است در حال حاضر مترادف با یادگیری ماشینی باشد و گوگل تمام تلاش خود را می کند تا خود را از زمین خارج کند، اما هر دو ممکن است به زودی با یک تهدید جدید روبرو شوند: تکثیر سریع پروژه های منبع باز که پیشرفت هنر را پیش می برد و افراد را در جیب های عمیق می گذارد. شرکت های ناتوان در گرد و غبار خود. این تهدید زرگ مانند ممکن است یک تهدید وجودی نباشد، اما مطمئناً بازیکنان مسلط را در خط دفاعی نگه می دارد.
این مفهوم در یک شات جدید نیست – در جامعه هوش مصنوعی که به سرعت در حال حرکت است، انتظار میرود که هر هفته شاهد این نوع اختلال باشد – اما این وضعیت توسط سندی که به طور گسترده به اشتراک گذاشته شده است که منشأ آن در گوگل است، نشان داده شد. در این یادداشت آمده است: «ما هیچ خندقی نداریم و OpenAI هم ندارد.
من خواننده را با خلاصهای طولانی از این قطعه کاملا خواندنی و جالب تحمیل نمیکنم، اما اصل ماجرا این است که در حالی که GPT-4 و سایر مدلهای اختصاصی سهم عمدهای از توجه و در واقع درآمد را به خود اختصاص دادهاند، شروع به کار کردهاند. با بودجه و زیرساخت روز به روز باریک تر به نظر می رسد.
در حالی که سرعت انتشار OpenAI ممکن است با توجه به استانداردهای نسخههای نرمافزار اصلی معمولی تاولکننده به نظر برسد: GPT-3، ChatGPT و GPT-4 مطمئناً اگر آنها را با نسخههای iOS یا فتوشاپ مقایسه کنید، بسیار جذاب بودند. اما آنها هنوز در مقیاس ماه ها و سال ها رخ می دهند.
آنچه در یادداشت به آن اشاره میشود این است که در ماه مارس، یک مدل زبان پایه فاش شده از متا، به نام LLaMA، به شکل نسبتاً خشن فاش شد. در داخل هفته هاافرادی که روی لپتاپها و سرورهای چند دقیقهای سر و کله میزنند، ویژگیهای اصلی مانند تنظیم دستورالعمل، روشهای متعدد و یادگیری تقویتی از بازخورد انسانی را اضافه کردهاند. OpenAI و Google نیز احتمالاً در حال بررسی کد بودند، اما آنها سطح همکاری و آزمایشی را که در subreddits و Discords اتفاق میافتد، تکرار نکردند – نمیتوانستند.
آیا واقعاً ممکن است مشکل محاسبات غول پیکری که به نظر میرسید مانعی غیرقابل عبور – یک خندق – برای چالشگران باشد، در حال حاضر یادگاری از دوران متفاوت توسعه هوش مصنوعی باشد؟
سام آلتمن قبلاً خاطرنشان کرد که هنگام بررسی پارامترها باید انتظار کاهش بازدهی را داشته باشیم. مطمئناً بزرگتر همیشه بهتر نیست – اما کمتر کسی حدس میزد که کوچکتر باشد.
GPT-4 یک وال مارت است و هیچ کس واقعاً وال مارت را دوست ندارد
پارادایم تجاری که اکنون توسط OpenAI و دیگران دنبال می شود، از نسل مستقیم مدل SaaS است. شما نرمافزار یا سرویسی با ارزش بالا دارید و از طریق یک API یا مواردی از این قبیل، دسترسی دقیقی به آن ارائه میدهید. این یک رویکرد ساده و اثبات شده است که زمانی کاملاً منطقی است که صدها میلیون دلار برای توسعه یک محصول یکپارچه و در عین حال همه کاره مانند یک مدل زبان بزرگ سرمایه گذاری کرده باشید.
اگر GPT-4 به خوبی برای پاسخ دادن به سؤالات مربوط به سوابق در حقوق قراردادها تعمیم می دهد، عالی است – اهمیتی نمی دهد که تعداد زیادی از «عقل» آن به این اختصاص داده شده است که بتواند سبک هر نویسنده ای را که تا به حال اثری به زبان انگلیسی منتشر کرده است، طوطی کند. GPT-4 مانند وال مارت است. هیچ کس در واقع می خواهد برای رفتن به آنجا، بنابراین شرکت مطمئن است که گزینه دیگری وجود ندارد.
اما مشتریان شروع به تعجب کردهاند که چرا من در 50 راهروی آشغال قدم میزنم تا چند سیب بخرم؟ چرا من خدمات بزرگترین و همهمنظورهترین مدل هوش مصنوعی را استخدام میکنم که تنها کاری که میخواهم انجام دهم این است که در تطبیق زبان این قرارداد با چند صد مورد دیگر هوشیاری داشته باشم؟ با خطر شکنجه کردن استعاره (از خواننده چیزی نگویم)، اگر GPT-4 وال مارتی است که برای سیب می روید، وقتی میوه فروشی در پارکینگ باز می شود چه اتفاقی می افتد؟
طولی نکشید که در دنیای هوش مصنوعی یک مدل زبان بزرگ، البته به شکل بسیار کوتاه، روی Raspberry Pi اجرا شد. برای کسبوکاری مانند OpenAI، مایکروسافت، گوگل، یا هرکس دیگری در دنیای هوش مصنوعی بهعنوان یک سرویس، بهطور مؤثری کل فرضیهی کسبوکار آنها را التماس میکند: ساخت و اجرای این سیستمها آنقدر سخت است که مجبورند آن را برای شما انجام دهد. در واقع به نظر می رسد که این شرکت ها نسخه ای از هوش مصنوعی را انتخاب کرده و مهندسی کرده اند که با مدل کسب و کار موجود خود مطابقت داشته باشد، نه برعکس!
روزی روزگاری مجبور بودید محاسبات مربوط به پردازش کلمه را در یک رایانه اصلی بارگذاری کنید – ترمینال شما فقط یک نمایشگر بود. البته آن دوره زمانی متفاوت بود، و ما از مدت ها قبل توانسته ایم کل برنامه را روی یک کامپیوتر شخصی قرار دهیم. از زمانی که دستگاه های ما به طور مکرر و به طور تصاعدی ظرفیت خود را برای محاسبات افزایش داده اند، این فرآیندها بارها اتفاق افتاده است. این روزها که باید کاری روی یک ابر رایانه انجام شود، همه می فهمند که این فقط یک مسئله زمان و بهینه سازی است.
برای گوگل و OpenAI، زمان بسیار سریعتر از حد انتظار فرا رسید. و آنها کسانی نبودند که بهینه سازی را انجام می دادند – و ممکن است هرگز با این سرعت نباشند.
حالا، این بدان معنا نیست که آنها کاملاً خوش شانس هستند. گوگل با بهترین بودن به جایی که هست نرسید – به هر حال برای مدت طولانی. وال مارت بودن مزایای خود را دارد. شرکتها نمیخواهند راهحل سفارشیای را پیدا کنند که وظیفه مورد نظرشان را 30 درصد سریعتر انجام دهد، اگر بتوانند قیمت مناسبی را از فروشنده فعلی خود دریافت کنند و قایق را زیاد تکان ندهند. هرگز ارزش اینرسی را در تجارت دست کم نگیرید!
مطمئناً، مردم آنقدر سریع در حال تکرار LLaMA هستند که برای نام بردن از شترهایشان تمام می شود. اتفاقاً، میخواهم از توسعهدهندگان تشکر کنم که بهانهای برای این که به جای کار کردن، صدها عکس از ویکوناهای بامزه و خرمایی را مرور کنند. اما تعداد کمی از دپارتمانهای فناوری اطلاعات سازمانی قصد دارند پیادهسازی مشتق منبع باز Stability را که در حال پیشرفت یک مدل متا فاش شده شبه قانونی است، روی API ساده و مؤثر OpenAI ترکیب کنند. آنها یک تجارت برای اداره کردن دارند!
اما در همان زمان، سالها پیش استفاده از فتوشاپ را برای ویرایش و ایجاد تصویر متوقف کردم، زیرا گزینههای منبع باز مانند Gimp و Paint.net بسیار خوب شدهاند. در این مرحله، بحث به سمت دیگری می رود. چقدر برای فتوشاپ بپردازید؟ به هیچ وجه، ما یک تجارت برای اداره داریم!
چیزی که نویسندگان ناشناس گوگل به وضوح نگران آن هستند این است که فاصله موقعیت اول تا موقعیت دوم بسیار کمتر از آن چیزی است که هر کسی فکر می کرد، و به نظر نمی رسد که هیچ کس نمی تواند در مورد آن انجام دهد.
به جز، یادداشت استدلال می کند: آن را در آغوش بگیر. باز کردن، انتشار، همکاری، اشتراک گذاری، سازش. همانطور که نتیجه می گیرند:
گوگل باید خود را به عنوان یک رهبر در جامعه منبع باز معرفی کند و با همکاری و به جای نادیده گرفتن گفتگوهای گسترده تر، رهبری را به عهده بگیرد. این احتمالاً به معنای انجام برخی اقدامات ناراحت کننده است، مانند انتشار وزن مدل برای انواع کوچک ULM. این لزوماً به معنای کنار گذاشتن برخی از کنترلها بر مدلهای ما است. اما این سازش اجتناب ناپذیر است. ما نمی توانیم امیدوار باشیم که هم نوآوری را هدایت کنیم و هم آن را کنترل کنیم.