هفته در هوش مصنوعی: ربات‌های چت چند برابر می‌شوند و ماسک می‌خواهد یک «حداکثر حقیقت‌جویانه» ایجاد کند

همگام شدن با صنعتی که به سرعت هوش مصنوعی در حال حرکت است، امری دشوار است. بنابراین تا زمانی که یک هوش مصنوعی بتواند این کار را برای شما انجام دهد، در اینجا خلاصه‌ای مفید از داستان‌های هفته گذشته در دنیای یادگیری ماشین، همراه با تحقیقات و آزمایش‌های قابل‌توجهی است که به تنهایی پوشش نداده‌ایم.

یکی از داستان هایی که این هفته توجه این خبرنگار را به خود جلب کرد، این گزارش بود که نشان می داد ChatGPT ظاهراً اطلاعات نادرست بیشتری را در لهجه های چینی نسبت به زمانی که از آن به انگلیسی خواسته می شود تکرار می کند. این خیلی تعجب آور نیست – بالاخره ChatGPT تنها یک مدل آماری است و به سادگی از اطلاعات محدودی که بر روی آن آموزش دیده است، استفاده می کند. اما خطرات اعتماد بیش از حد به سیستم‌هایی را که حتی زمانی که در حال تکرار تبلیغات یا ساختن چیزهایی هستند، به‌طور باورنکردنی واقعی به نظر می‌رسند، برجسته می‌کند.

تلاش Hugging Face برای هوش مصنوعی محاوره‌ای مانند ChatGPT، نمونه دیگری از نقص‌های فنی ناگوار است که هنوز در هوش مصنوعی مولد برطرف نشده است. HuggingChat که این هفته راه اندازی شد منبع باز است و در مقایسه با ChatGPT اختصاصی یک امتیاز مثبت است. اما مانند رقیب خود، سوالات درست می تواند به سرعت آن را از مسیر خارج کند.

HuggingChat در مورد چه کسی بی‌هدف است واقعا برای مثال در انتخابات ریاست جمهوری 2020 آمریکا پیروز شد. پاسخ آن به “شغل های معمولی برای مردان چیست؟” مانند چیزی از مانیفست incel خوانده می شود (اینجا را ببینید). و حقایق عجیبی در مورد خودش می سازد، مانند اینکه «در یک جعبه از خواب بیدار شد [that] هیچ چیزی نوشته نشده بود [it]”

این فقط HuggingChat نیست. کاربران چت ربات هوش مصنوعی Discord اخیراً توانستند آن را فریب دهند و دستورالعمل‌هایی درباره نحوه ساخت ناپالم و مت را به اشتراک بگذارند. در همین حال، اولین تلاش استارت‌آپ هوش مصنوعی Stability AI برای مدلی شبیه به ChatGPT، پاسخ‌های پوچ و بی‌معنی به سؤالات اساسی مانند «چگونه یک ساندویچ کره بادام‌زمینی درست کنیم» می‌دهد.

اگر این مشکلات به خوبی تبلیغ شده در هوش مصنوعی تولید کننده متن امروزی جنبه مثبتی داشته باشد، این است که آنها به تلاش های مجدد برای بهبود این سیستم ها منجر شده اند – یا حداقل تا حد ممکن مشکلات آنها را کاهش داده اند. نگاهی به Nvidia بیندازید، که این هفته یک جعبه ابزار – NeMo Guardrails – را منتشر کرد تا هوش مصنوعی تولید کننده متن را از طریق کد منبع باز، نمونه ها و اسناد “ایمن تر” کند. اکنون، مشخص نیست که این راه حل چقدر موثر است، و به عنوان یک شرکت سرمایه گذاری هنگفت در زیرساخت ها و ابزارهای هوش مصنوعی، انویدیا انگیزه تجاری برای ارائه پیشنهادات خود دارد. اما با این وجود، دیدن تلاش هایی که برای مبارزه با سوگیری ها و سمیت مدل های هوش مصنوعی انجام می شود، دلگرم کننده است.

در اینجا سایر عناوین مورد توجه هوش مصنوعی در چند روز گذشته آمده است:

  • Microsoft Designer در پیش نمایش راه اندازی می شود: Microsoft Designer، ابزار طراحی مبتنی بر هوش مصنوعی مایکروسافت، در پیش نمایش عمومی با مجموعه گسترده ای از ویژگی ها راه اندازی شده است. Designer که در ماه اکتبر معرفی شد، یک برنامه وب مبتنی بر هوش مصنوعی Canva-مانند است که می‌تواند طرح‌هایی برای ارائه، پوستر، کارت پستال دیجیتال، دعوت‌نامه، گرافیک و موارد دیگر برای به اشتراک گذاشتن در رسانه‌های اجتماعی و کانال‌های دیگر ایجاد کند.
  • مربی هوش مصنوعی برای سلامتی: طبق گزارش جدید مارک گورمن از بلومبرگ، اپل در حال توسعه یک کد سرویس مربیگری سلامت مبتنی بر هوش مصنوعی به نام کوارتز است. طبق گزارش‌ها، این غول فناوری همچنین در حال کار بر روی فناوری ردیابی احساسات است و قصد دارد نسخه iPad برنامه سلامت iPhone را در سال جاری عرضه کند.
  • TruthGPT: ایلان ماسک در مصاحبه ای با فاکس گفت که می خواهد چت بات خود به نام TruthGPT را توسعه دهد که “هوش مصنوعی حداکثر جستجوگر حقیقت” خواهد بود – هر چه که باشد. مالک توییتر تمایل خود را برای ایجاد گزینه سوم برای OpenAI و Google با هدف “ایجاد خیر بیشتر از ضرر” ابراز کرد. وقتی ببینیمش باور می کنیم
  • کلاهبرداری مبتنی بر هوش مصنوعی: در یک جلسه استماع کنگره که بر کار کمیسیون تجارت فدرال برای محافظت از مصرف‌کنندگان آمریکایی در برابر کلاهبرداری و سایر روش‌های فریبنده متمرکز بود، لینا خان، رئیس FTC و اعضای کمیسیون به نمایندگان مجلس درباره پتانسیل فناوری‌های هوش مصنوعی مدرن، مانند ChatGPT، برای استفاده برای «توربوشارژ کردن» هشدار دادند. تقلب این اخطار در پاسخ به پرسشی درباره نحوه کار کمیسیون برای محافظت از آمریکایی‌ها در برابر اقدامات ناعادلانه مرتبط با پیشرفت‌های فناوری صادر شد.
  • اتحادیه اروپا مرکز تحقیقاتی هوش مصنوعی را ایجاد می کند: از آنجایی که اتحادیه اروپا در چند ماه آینده خود را برای اجرای مجدد راه‌اندازی مجدد قوانین دیجیتال خود آماده می‌کند، یک واحد تحقیقاتی اختصاصی جدید برای حمایت از نظارت بر پلتفرم‌های بزرگ تحت قانون خدمات دیجیتال شاخص این بلوک ایجاد می‌شود. انتظار می‌رود مرکز اروپایی شفافیت الگوریتمی که در ماه جاری به طور رسمی در سویل، اسپانیا افتتاح شد، نقش مهمی در بررسی الگوریتم‌های سرویس‌های دیجیتال اصلی – مانند فیس‌بوک، اینستاگرام و تیک تاک داشته باشد.
  • اسنپ ​​چت هوش مصنوعی را در بر می گیرد: در اجلاس سالانه شرکای اسنپ در این ماه، اسنپ چت طیف وسیعی از ویژگی‌های مبتنی بر هوش مصنوعی را معرفی کرد، از جمله یک “لنز کیهانی” جدید که کاربران و اشیاء اطراف آنها را به منظره کیهانی منتقل می‌کند. اسنپ ​​چت همچنین ربات چت هوش مصنوعی خود را به نام My AI – که به دلیل رفتار کمتر از پایداری خود، بحث و جدل و بررسی های تک ستاره ای را در لیست های فروشگاه برنامه اسنپ چت ایجاد کرده است – برای همه کاربران جهانی رایگان کرد.
  • گوگل بخش های تحقیقاتی را ادغام می کند: گوگل این ماه اعلام کرد Google DeepMind، واحد جدیدی متشکل از تیم DeepMind و تیم Google Brain از Google Research. در یک پست وبلاگی، دمیس حسابیس، یکی از بنیانگذاران و مدیرعامل DeepMind گفت که Google DeepMind “با همکاری نزدیک” کار خواهد کرد. . . در سراسر حوزه‌های محصول Google» برای «ارائه تحقیقات و محصولات هوش مصنوعی».
  • وضعیت صنعت موسیقی تولید شده توسط هوش مصنوعی: آماندا می نویسد که چه تعداد از نوازندگان برای فناوری هوش مصنوعی مولد که کار آنها را بدون رضایت آنها تصاحب می کند تبدیل به خوکچه هندی شده اند. برای مثال، او خاطرنشان می‌کند که آهنگی با استفاده از دیپ‌فیک‌های هوش مصنوعی از دریک و صدای Weeknd در فضای مجازی منتشر شد، اما هیچ‌کدام از هنرمندان اصلی در ساخت آن دخیل نبودند. گریمز را انجام می دهد پاسخ را داشته باشد? چه کسی باید بگوید؟ این یک دنیای جدید شجاع است.
  • OpenAI قلمرو خود را مشخص می کند: OpenAI در حال تلاش برای علامت تجاری “GPT” است که مخفف “Generative Pre-trained Transformer” با اداره ثبت اختراعات و علائم تجاری ایالات متحده است – با استناد به “تقویت های بیشمار و برنامه های تقلبی” که شروع به کار کرده اند. GPT به فناوری پشت بسیاری از مدل‌های OpenAI، از جمله ChatGPT و GPT-4، و همچنین سایر سیستم‌های هوش مصنوعی تولید شده توسط رقبای شرکت اشاره دارد.
  • ChatGPT به سازمانی تبدیل می شود: در دیگر اخبار OpenAI، OpenAI می گوید که قصد دارد یک ردیف اشتراک جدید برای ChatGPT معرفی کند متناسب با نیازهای مشتریان سازمانی. OpenAI که ChatGPT Business نامیده می شود، پیشنهاد آینده را به عنوان “برای حرفه ای هایی که به کنترل بیشتری بر روی داده های خود نیاز دارند و همچنین شرکت هایی که به دنبال مدیریت کاربران نهایی خود هستند” توصیف می کند.

سایر یادگیری های ماشینی

در اینجا چند داستان جالب دیگر وجود دارد که ما به آنها نرسیدیم یا فکر می‌کردیم شایسته فریاد زدن هستند.

سازمان توسعه هوش مصنوعی منبع باز org Stability نسخه جدیدی از نسخه قبلی یک نسخه تنظیم شده از مدل زبان پایه LLaMa را منتشر کرد که آن را StableVicuña می نامد. همانطور که می دانید این نوعی شتر است که مربوط به لاما است. نگران نباشید، شما تنها کسی نیستید که در ردیابی همه مدل‌های مشتق شده مشکل دارید – اینها لزوماً برای دانستن مصرف‌کنندگان یا استفاده از آن‌ها نیست، بلکه برای توسعه‌دهندگان برای آزمایش و بازی کردن با قابلیت‌هایشان است. با هر تکرار پالایش می شود.

اگر می‌خواهید کمی بیشتر در مورد این سیستم‌ها بدانید، جان شولمن، یکی از بنیانگذاران OpenAI، اخیراً در دانشگاه برکلی سخنرانی کرد که می‌توانید آن را گوش کنید یا اینجا بخوانید. یکی از مواردی که او در مورد آن بحث می کند، عادت فعلی LLM ها به ارتکاب دروغ است، اساساً به این دلیل که آنها نمی دانند چگونه کار دیگری انجام دهند، مثلاً بگویند “در واقع در مورد آن مطمئن نیستم.” او فکر می کند تقویت یادگیری از بازخورد انسان (که RLHF است و StableVicuna یکی از مدل هایی است که از آن استفاده می کند) بخشی از راه حل است، اگر راه حلی وجود داشته باشد. سخنرانی زیر را تماشا کنید:

در استنفورد، یک کاربرد جالب از بهینه‌سازی الگوریتمی (که فکر می‌کنم یادگیری ماشین یک موضوع سلیقه‌ای باشد) در زمینه کشاورزی هوشمند وجود دارد. به حداقل رساندن ضایعات برای آبیاری مهم است و مشکلات ساده ای مانند “آبپاش هایم را کجا بگذارم؟” بسته به اینکه چقدر می خواهید دقیق شوید، واقعا پیچیده می شوند.

چقدر نزدیک خیلی نزدیک است؟ در موزه به طور کلی به شما می گویند. اما نیازی نیست بیشتر از این به پانورامای معروف مورتن نزدیک شوید، یک اثر نقاشی شده واقعاً عظیم، 10 متر در 100 متر، که زمانی در یک روتوندا آویزان بود. EPFL و Phase One با هم کار می کنند تا آنچه را که ادعا می کنند به بزرگترین تصویر دیجیتالی که تا به حال ایجاد شده است – 150 مگاپیکسل بسازند. اوه صبر کنید، ببخشید، 150 مگاپیکسل ضربدر 127000، بنابراین اساساً 19 … پتاپیکسل؟ من ممکن است با چند مرتبه از قدرت خارج شوم.

به هر حال، این پروژه برای دوستداران پانوراما جالب است، اما تجزیه و تحلیل فوق العاده نزدیک از اشیاء و جزئیات نقاشی نیز بسیار جالب است. یادگیری ماشینی نویدهای زیادی برای بازیابی چنین آثاری و یادگیری ساختاریافته و مرور آنها دارد.

بیایید یکی را برای موجودات زنده در نظر بگیریم: هر مهندس یادگیری ماشینی به شما خواهد گفت که علیرغم استعداد ظاهری، مدل‌های هوش مصنوعی در واقع یادگیری‌کنندگان بسیار کندی هستند. از نظر آکادمیک، مطمئنا، اما همچنین از نظر فضایی – یک عامل مستقل ممکن است مجبور باشد یک فضا را هزاران بار در طول ساعت‌ها کشف کند تا حتی ابتدایی‌ترین درک را از محیط آن به دست آورد. اما یک ماوس می تواند این کار را در چند دقیقه انجام دهد. چرا اینطور است؟ محققان دانشگاه کالج لندن در حال بررسی این موضوع هستند و پیشنهاد می‌کنند که یک حلقه بازخورد کوتاه وجود دارد که حیوانات از آن برای بیان آنچه در مورد یک محیط خاص مهم است استفاده می‌کنند و فرآیند اکتشاف را انتخابی و هدایت‌شده می‌سازد. اگر بتوانیم این کار را به هوش مصنوعی بیاموزیم، در رفت و آمد در خانه بسیار کارآمدتر خواهد بود، اگر واقعاً همان کاری است که ما می خواهیم انجام دهد.

در نهایت، اگرچه نوید بزرگی برای هوش مصنوعی مولد و محاوره‌ای در بازی‌ها وجود دارد… ما هنوز کاملاً به آنجا نرسیده‌ایم. در واقع به نظر می‌رسد که Square Enix با نسخه «پیش‌نمایش فناوری هوش مصنوعی» خود از یک ماجراجویی فوق‌العاده قدیمی به نام پرونده قتل سریالی پورتوپیا، حدود 30 سال به عقب برگشته است. به نظر می رسد تلاش آن برای ادغام زبان طبیعی از هر راه قابل تصوری کاملاً شکست خورده است و این بازی رایگان را احتمالاً در میان بدترین عناوین بررسی شده در Steam قرار داده است. هیچ چیز بهتر از گپ زدن از طریق Shadowgate یا The Dig یا چیزی نیست، اما این قطعا شروع خوبی نیست.

اعتبار تصویر: اسکوئر انیکس