تلاش سیلیکون ولی برای خودکار کردن همه چیز بی وقفه است، که آخرین وسواس آن را توضیح می دهد: Auto-GPT.
در اصل، Auto-GPT از تطبیق پذیری آخرین مدلهای هوش مصنوعی OpenAI برای تعامل با نرمافزار و سرویسهای آنلاین استفاده میکند و به آن اجازه میدهد تا بهطور خودکار وظایفی مانند X و Y را انجام دهد. اما همانطور که ما در حال یادگیری با مدلهای زبان بزرگ هستیم، به نظر میرسد که این قابلیت وجود دارد. به وسعت یک اقیانوس اما به عمق یک گودال.
Auto-GPT – که ممکن است اخیراً در رسانه های اجتماعی منفجر شده باشد – یک برنامه متن باز است که توسط توسعه دهنده بازی Toran Bruce Richards ایجاد شده است. که از مدلهای تولید متن OpenAI، عمدتاً GPT-3.5 و GPT-4، برای عمل «خودکار» استفاده میکند.
هیچ جادویی در آن خودمختاری وجود ندارد. Auto-GPT به سادگی پیگیری های اولیه مدل های OpenAI را انجام می دهد، تا زمانی که یک کار کامل شود، آنها را می پرسد و پاسخ می دهد.
Auto-GPT، اساسا، GPT-3.5 و GPT-4 است که با یک ربات همراه جفت شده است که به GPT-3.5 و GPT-4 دستور می دهد که چه کاری انجام دهند. یک کاربر به Auto-GPT می گوید که هدفش چیست و ربات نیز به نوبه خود از GPT-3.5 و GPT-4 و چندین برنامه برای انجام هر مرحله لازم برای رسیدن به هدفی که تعیین کرده است استفاده می کند.
چیزی که Auto-GPT را تا حد معقولی میسازد، توانایی آن در تعامل با برنامهها، نرمافزارها و سرویسهای آنلاین و محلی است، مانند مرورگرهای وب و پردازشگرهای کلمه. به عنوان مثال، با توجه به درخواستی مانند “به من کمک کنید تجارت گل من را توسعه دهم”، Auto-GPT می تواند یک استراتژی تبلیغاتی تا حدودی قابل قبول ایجاد کنید و یک وب سایت اولیه بسازید.
همانطور که جو کوئن، یک توسعهدهنده نرمافزاری که با Auto-GPT آزمایش کرده است، از طریق ایمیل به TechCrunch توضیح داد، Auto-GPT اساساً پروژههای چند مرحلهای را خودکار میکند که نیاز به اعلانهای رفت و برگشتی با یک مدل هوش مصنوعی مبتنی بر چتبات دارند، مثلاً. ، ChatGPT OpenAI.
کوئن گفت: “Auto-GPT عاملی را تعریف می کند که با API OpenAI ارتباط برقرار می کند.” “هدف این عامل اجرای دستورات مختلفی است که هوش مصنوعی در پاسخ به درخواست های عامل ایجاد می کند. از کاربر خواسته می شود تا قبل از اینکه عامل شروع به اجرای دستورات کند، نقش و اهداف هوش مصنوعی را مشخص کند.”
در یک ترمینال، کاربران نام، نقش و هدف عامل Auto-GPT را توصیف می کنند و حداکثر پنج راه را برای دستیابی به آن هدف مشخص می کنند. مثلا:
- نام: گوشی هوشمند-GPT
- نقش: هوش مصنوعی طراحی شده برای یافتن بهترین گوشی هوشمند
- هدف، واقعگرایانه: بهترین گوشی های هوشمند موجود در بازار را پیدا کنید
- هدف 1: تحقیقات بازار را برای گوشی های هوشمند مختلف موجود در بازار امروز انجام دهید
- هدف 2: پنج گوشی هوشمند برتر را دریافت کنید و مزایا و معایب آنها را فهرست کنید
در پشت صحنه، Auto-GPT به ویژگی هایی مانند مدیریت حافظه برای اجرای وظایف، همراه با GPT-4 و GPT-3.5 برای تولید متن، ذخیره سازی فایل و خلاصه سازی متکی است.
Auto-GPT همچنین می تواند به سینت سایزرهای گفتار مانند ElevenLabs متصل شود، به طوری که می تواند تماس های تلفنی را به عنوان مثال “قرار دهد”.
Auto-GPT به صورت عمومی در GitHub در دسترس است، اما برای راهاندازی و اجرا به برخی تنظیمات و دانش نیاز دارد. برای استفاده از آن، Auto-GPT باید در یک محیط توسعه مانند Docker نصب شود، و باید با یک کلید API از OpenAI ثبت شود – که به یک حساب OpenAI پولی نیاز دارد.
ممکن است ارزشش را داشته باشد – اگرچه هیئت منصفه در این مورد نظر دارند. پذیرندگان اولیه از Auto-GPT برای انجام انواع کارهای پیش پا افتاده استفاده کرده اند که بهتر به یک ربات واگذار می شود. برای مثال، Auto-GPT میتواند مواردی مانند اشکالزدایی کد و نوشتن ایمیل یا چیزهای پیشرفتهتری مانند ایجاد یک طرح کسبوکار برای یک استارتآپ جدید را وارد کند.
عدنان مسعود، معمار ارشد در UST، یک شرکت مشاوره فناوری، گفت: «اگر Auto-GPT با هر گونه مانع یا ناتوانی در تکمیل کار مواجه شود، دستورات جدیدی را برای کمک به موقعیت و تعیین گام های بعدی مناسب ایجاد می کند. TechCrunch در یک ایمیل. «مدلهای زبان بزرگ در ایجاد پاسخهایی شبیه به انسان برتری دارند، اما برای ارائه نتایج دلخواه به پیامهای کاربر و تعاملات متکی هستند. در مقابل، Auto-GPT از قابلیتهای پیشرفته API OpenAI استفاده میکند تا بهطور مستقل و بدون دخالت کاربر عمل کند.
در هفتههای اخیر، اپلیکیشنهای جدیدی ظاهر شدهاند که استفاده از Auto-GPT را حتی آسانتر میکنند، مانند AgentGPT و GodMode، که یک رابط کاربری ساده را ارائه میکنند که در آن کاربران میتوانند آنچه را که میخواهند مستقیماً در یک صفحه مرورگر وارد کنند. توجه داشته باشید که مانند Agent-GPT، هر دو به یک کلید API از OpenAI نیاز دارند تا قابلیتهای کامل خود را باز کنند.
با این حال، مانند هر ابزار قدرتمندی، Auto-GPT محدودیتها و خطرات خود را دارد.
بسته به هدفی که ابزار ارائه شده است، Auto-GPT می تواند به روش های بسیار غیرمنتظره ای رفتار کند. یکی از کاربران Reddit ادعا می کند که با توجه به بودجه 100 دلاری برای خرج کردن در یک نمونه سرور، Auto-GPT یک صفحه ویکی روی گربه ها ایجاد کرد، از یک نقص در نمونه برای دسترسی به سطح مدیریت سوء استفاده کرد و محیط پایتون را که در آن قرار داشت تحت کنترل گرفت. دویدن – و سپس خود را “کشت”.
همچنین ChaosGPT، یک نسخه اصلاح شده از Auto-GPT با اهدافی مانند «از بین بردن بشریت» و «برقراری سلطه جهانی» وجود دارد. جای تعجب نیست که ChaosGPT به ایجاد آخرالزمان ربات نزدیک نشده است – اما توئیتی نسبتاً نامطلوب در مورد نوع بشر منتشر کرده است.
البته خطرناکتر از تلاش Auto-GPT برای «نابودی بشریت»، مشکلات پیشبینی نشدهای هستند که میتوانند در سناریوهای کاملاً عادی ظاهر شوند. از آنجا که بر روی مدلهای زبان OpenAI ساخته شده است – مدلهایی که مانند همه مدلهای زبانی مستعد عدم دقت هستند – میتواند خطا ایجاد کند.
این تنها مشکل نیست. پس از انجام موفقیت آمیز یک کار، Auto-GPT معمولاً نحوه اجرای آن را برای استفاده بعدی به خاطر نمی آورد، و – حتی زمانی که انجام می دهد – اغلب استفاده از برنامه را به خاطر نمی آورد. Auto-GPT همچنین برای تقسیم مؤثر وظایف پیچیده به وظایف فرعی سادهتر تلاش میکند و در درک نحوه همپوشانی اهداف مختلف مشکل دارد.
Clara Shih، مدیر عامل Salesforce’s Service Cloud و یکی از علاقه مندان Auto-GPT، از طریق ایمیل گفت: “Auto-GPT قدرت و خطرات ناشناخته هوش مصنوعی مولد را نشان می دهد.” برای شرکتها، در هنگام توسعه و استفاده از فناوریهای هوش مصنوعی مانند Auto-GPT، بسیار مهم است که انسان را در رویکرد حلقه قرار دهند.