این هوش مصنوعی از GPT-4 برای تبدیل شدن به یک بازیکن خبره Minecraft استفاده کرد

محققان هوش مصنوعی یک ربات Minecraft ساخته‌اند که می‌تواند قابلیت‌های خود را در دنیای باز بازی کاوش کرده و گسترش دهد – اما برخلاف سایر ربات‌ها، این ربات اساساً کد خود را از طریق آزمون و خطا نوشت. مقدار زیادی از جستارهای GPT-4.

این سیستم آزمایشی که وویجر نامیده می‌شود، نمونه‌ای از یک «عامل تجسم‌شده» است، یک هوش مصنوعی که می‌تواند آزادانه و هدفمند در یک محیط شبیه‌سازی شده یا واقعی حرکت کند و عمل کند. هوش مصنوعی و چت ربات‌های نوع دستیار شخصی نیازی به انجام کارها ندارند، چه رسد به اینکه برای انجام این کارها در دنیای پیچیده حرکت کنند. اما این دقیقاً همان کاری است که از یک ربات خانگی انتظار می رود در آینده انجام دهد، بنابراین تحقیقات زیادی در مورد چگونگی انجام این کار وجود دارد.

Minecraft مکان خوبی برای آزمایش چنین چیزهایی است زیرا نمایشی بسیار (بسیار) تقریبی از دنیای واقعی، با قوانین و فیزیک ساده و سرراست، اما همچنین به اندازه کافی پیچیده و باز است که کارهای زیادی برای انجام دادن یا امتحان کردن وجود دارد. شبیه سازهای هدفمند نیز عالی هستند، اما محدودیت های خاص خود را دارند.

MineDojo یک چارچوب شبیه‌سازی است که حول Minecraft ساخته شده است، زیرا شما نمی‌توانید فقط یک هوش مصنوعی تصادفی را در آنجا قرار دهید و انتظار داشته باشید که بفهمد همه این بلوک‌ها و خوک‌ها چه می‌کنند. سازندگان آن (همپوشانی های زیادی با تیم Voyager) ویدیوهای YouTube درباره بازی، رونوشت ها، مقالات ویکی، و تعداد زیادی پست Reddit از r/minecraft، در میان داده های دیگر را گرد هم می آورند، بنابراین کاربران می توانند یک مدل هوش مصنوعی ایجاد یا تنظیم کنند. بر روی آنها همچنین این امکان را فراهم می‌کند که این مدل‌ها با مشاهده اینکه چقدر خوب کارهایی مانند ساختن حصار دور یک لاما یا پیدا کردن و استخراج الماس را انجام می‌دهند، کم و بیش عینی ارزیابی شوند.

وویجر در این وظایف عالی عمل می کند و عملکرد بسیار بهتری نسبت به تنها مدل نزدیک به آن یعنی AutoGPT دارد. اما آنها رویکرد مشابهی دارند: استفاده از GPT-4 برای نوشتن کد خود در حین حرکت.

معمولاً شما فقط یک مدل را با تمام داده‌های خوب Minecraft آموزش می‌دهید و امیدواریم که بفهمد وقتی خورشید غروب می‌کند چگونه با اسکلت‌ها مبارزه کند. با این حال، Voyager نسبتا ساده شروع می‌کند، و همانطور که در بازی با چیزهایی روبرو می‌شود، گفتگوی داخلی کمی با GPT-4 در مورد اینکه چه کاری باید انجام دهد و چگونه انجام می‌دهد، دارد.

هدایت اکشن بعدی و افزودن مهارت ها به مجموعه.

برای مثال، بگویید شب می‌رسد و آن اسکلت‌ها بیرون می‌آیند. نماینده یک ایده کلی از این موضوع دارد، اما از خود می پرسد، وقتی هیولاهایی در این نزدیکی وجود دارند، یک بازیکن خوب این بازی چه می کند؟ خوب، GPT-4 می‌گوید، اگر می‌خواهید با خیال راحت جهان را کاوش کنید، می‌خواهید یک شمشیر بسازید و مجهز کنید، سپس اسکلت را با آن بکوبید و از ضربه خوردن اجتناب کنید. و این حس کلی از اینکه چه باید کرد به اهداف ملموس تبدیل می شود: جمع آوری سنگ و چوب، ساختن شمشیر روی میز کاردستی، تجهیز آن و مبارزه با اسکلت.

پس از انجام آن کارها، آنها وارد یک کتابخانه مهارت عمومی می شوند تا بعداً، زمانی که کار این است که «به اعماق غار بروید تا سنگ آهن پیدا کنید»، لازم نیست دوباره از ابتدا جنگیدن را یاد بگیرد. هنوز هم از GPT استفاده می‌کند، اما از GPT-3.5 ارزان‌تر و سریع‌تر، که به آن مهارت‌های مرتبط‌تر با یک موقعیت خاص را می‌گوید – بنابراین سعی نمی‌کند اسکلت را استخراج کند و با سنگ معدن مبارزه کند.

این شبیه به عاملی مانند AutoGPT است، هنگامی که با رابطی روبرو می شود که هنوز نمی شناسد، باید به خود یاد دهد که در آن حرکت کند تا به هدف خود برسد. اما Minecraft یک محیط بسیار عمیق تر از آن است که برای حل آن استفاده می شود، بنابراین یک عامل تخصصی مانند Voyager بسیار بهتر عمل می کند. این ربات ها چیزهای بیشتری پیدا می کند، مهارت های بیشتری را می آموزد و منطقه بسیار بیشتری را نسبت به سایر ربات ها کاوش می کند.

جالب است هر چند شاید تعجب آور نباشد، GPT-4 وقتی نوبت به تولید کد مفید می رسد، زمین را با GPT-3.5 (یعنی ChatGPT) پاک می کند. آزمایشی که جایگزین اولی با دومی شد، باعث شد که عامل در اوایل، شاید حتی به معنای واقعی کلمه، به دیوار برخورد کند و بهبود نیابد. ممکن است از صحبت کردن با این دو مدل مشخص نباشد که یکی بسیار باهوش‌تر است، اما حقیقت این است که برای انجام یک مکالمه ظاهراً هوشمند، لازم نیست به‌ویژه باهوش باشید (از من بپرسید از کجا می‌دانم). کدنویسی بسیار دشوارتر است و GPT-4 یک به روز رسانی بزرگ در آنجا بود.

هدف این تحقیق منسوخ شدن بازیکنان Minecraft نیست، بلکه یافتن روش‌هایی است که مدل‌های هوش مصنوعی نسبتاً ساده می‌توانند بر اساس «تجارب» خود، به دلیل نداشتن کلمه بهتر، خود را بهبود بخشند. اگر می‌خواهیم روبات‌هایی داشته باشیم که در خانه‌ها، بیمارستان‌ها و ادارات به ما کمک می‌کنند، آن‌ها باید این درس‌ها را یاد بگیرند و در اقدامات آینده به کار ببرند.

شما می توانید اطلاعات بیشتری در مورد Voyager در اینجا بخوانید.