مایکروسافت شروع به کار می کند در مرحله بعدی گسترش بینگ. و – جای تعجب نیست – به شدت حول محور هوش مصنوعی می چرخد.
در یک رویداد پیش نمایش این هفته در شهر نیویورک، مدیران مایکروسافت از جمله یوسف مهدی، CVP و مدیر بازاریابی مصرف کننده، به اعضای مطبوعات از جمله این گزارشگر نگاهی به طیف وسیعی از ویژگی هایی که طی چند روز، هفته آینده به بینگ می روند، ارائه کردند. و ماه ها
آنها آنقدر چرخ را دوباره اختراع نمی کنند، بلکه بر اساس آنچه مایکروسافت طی سه ماه گذشته یا بیشتر به تجربه بینگ تزریق کرده است، می پردازند. مایکروسافت از زمان راهاندازی Bing Chat، چت ربات مبتنی بر هوش مصنوعی که از مدلهای GPT-4 و DALL-E 2 OpenAI پشتیبانی میکند، میگوید که بازدیدکنندگان Bing – که به بیش از 100 میلیون کاربر فعال روزانه افزایش یافته است – در بیش از نیم میلیارد چت و چت شرکت کردهاند. بیش از 200 میلیون تصویر ایجاد کرد.
با نگاه کردن به آینده، Bing بصری تر خواهد شد، به لطف پاسخ های بیشتر تصویر و گرافیک محور در Bing Chat. همچنین شخصیتر میشود، با قابلیتهایی که به کاربران اجازه میدهد تا تاریخچههای گپ بینگ خود را صادر کنند و محتوا را از افزونههای شخص ثالث بکشند (در ادامه به آنها خواهیم پرداخت). و چندوجهی بودن را در بر می گیرد، حداقل به این معنا که بینگ چت می تواند به سوالات در زمینه تصاویر پاسخ دهد.
مهدی در اظهارات آماده شده گفت: «فکر میکنم به جرات بتوان گفت که در حال تحول در جستجو هستیم. “در ذهن ما، ما فکر می کنیم که امروز آغاز نسل بعدی این “ماموریت جستجو” خواهد بود.”
باز و بصری
از امروز، Bing جدید – یکی با Bing Chat – اکنون بدون لیست انتظار در دسترس است. هرکسی میتواند با ورود به سیستم با یک حساب مایکروسافت آن را امتحان کند.
این کم و بیش تجربه ای است که چند ماه پیش راه اندازی شد. اما همانطور که قبلا اشاره شد، بینگ چت به زودی با تصاویر پاسخ خواهد داد – حداقل در جایی که منطقی باشد. پاسخ به سؤالات (مثلاً “ماچو پیچو کجاست؟”) در صورت وجود، با تصاویر مرتبط همراه خواهد بود، بسیار شبیه به جریان جستجوی استاندارد Bing اما در یک رابط کارت مانند فشرده شده است.
در یک دمو در این رویداد، یک سخنگوی این سوال را تایپ کرد: “آیا کاکتوس ساگوارو گل میسازد؟” و بینگ چت پاسخی به طول پاراگراف در کنار تصویری از کاکتوس مورد نظر ارائه کردند. برای من، “پانل های دانش” را در جستجوی گوگل برانگیخت.
مایکروسافت نمی گوید که کدام دسته از محتوا، دقیقاً ممکن است یک تصویر را تحریک کند. اما برای جلوگیری از ظاهر شدن تصاویر صریح – یا اینطور ادعا می کند، فیلتری در آن وجود دارد.
سارا برد، رئیس هوش مصنوعی مسئول در مایکروسافت، به من گفت که بینگ چت از فیلتر کردن و تعدیل موجود در جستجوی بینگ سود می برد. فراتر از این، بینگ چت از ترکیبی از «طبقهبندیکنندههای سمیت» یا مدلهای هوش مصنوعی آموزشدیده برای شناسایی پیامهای بالقوه مضر و لیستهای سیاه برای تمیز نگه داشتن چت استفاده میکند.
شایان ذکر است، این اقدامات مانع از آن نشد که بینگ چت در ابتدای فوریه در پیش نمایش منتشر شود. پوشش ما متوجه شد که ربات چت اطلاعات نادرست واکسن را منتشر میکند و از دیدگاه آدولف هیتلر سخنی نفرتانگیز مینویسد. گزارشگران دیگر آن را برای تهدید، ادعای هویت های متعدد و حتی شرمساری آنها به خاطر توصیه آن دریافت کردند.
در یک ضربه دیگر به مایکروسافت، این شرکت فقط چند ماه پیش تیم اخلاق و جامعه را در سازمان بزرگتر هوش مصنوعی خود اخراج کرد. این اقدام مایکروسافت را بدون تیم اختصاصی برای اطمینان از اینکه اصول هوش مصنوعی آن با طراحی محصول مرتبط است، رها کرد.
با این حال، Bird ادعا میکند که پیشرفتهای معنیداری حاصل شده است و این نوع مشکلات هوش مصنوعی یک شبه حل نمیشوند – هر چند Bing Chat ممکن است عمومی باشد. او گفت که در میان اقدامات دیگر، تیمی از ناظران انسانی برای نظارت بر سوء استفاده وجود دارد، مانند تلاش کاربران برای استفاده از بینگ چت برای تولید ایمیلهای فیشینگ.
اما – از آنجایی که به اعضای مطبوعات این فرصت داده نشد تا با آخرین نسخه بینگ فراتر از نمایشهای نمایشی کنترلشده تعامل داشته باشند – نمیتوانم بگویم تا چه حد همه اینها تفاوت ایجاد کرده است. بدون شک زمانی که افراد دیگری دست خود را به آن برسانند، روشن خواهد شد.
یکی از جنبه های بینگ چت که است بهبود شفافیت پیرامون پاسخهای آن است – بهویژه پاسخهایی که ماهیت مبتنی بر واقعیت دارند. به زودی، وقتی از شما خواسته میشود که یک سند یا محتوای یک سند را خلاصه کنید (مثلاً «این صفحه در مورد پل بروکلین چه میگوید؟»)، چه یک PDF 20 صفحهای یا یک مقاله ویکیپدیا، بینگ چت شامل نقل قولهایی خواهد شد که نشان میدهد از کجا در متنی که اطلاعات از آن آمده است. با کلیک بر روی آنها، قسمت مربوطه برجسته می شود.
بهره وری در حال ظهور
در یکی دیگر از ویژگیهای جدید در بخش بصری، بینگ چت میتواند نمودارها و نمودارها را در صورت تغذیه مناسب و دادهها ایجاد کند. قبلاً چیزی مانند “پرجمعیت ترین شهرهای برزیل کدامند؟” یک لیست اساسی از نتایج را به همراه خواهد داشت. اما در یک پیشنمایش نزدیک به آینده، بینگ چت این نتایج را به صورت بصری و در نوع نمودار انتخابی کاربر ارائه میکند.
این ظاهراً نشاندهنده گامی برای Bing به سمت یک پلتفرم بهرهوری کامل است، بهویژه زمانی که با قابلیتهای تولید متن به تصویر بهبودیافته همراه شود.
در هفتههای آینده، Bing Image Creator – ابزار مایکروسافت که میتواند تصاویر را از پیامهای متنی تولید کند، با پشتیبانی از DALL-E 2 – زبانهای بیشتری را به غیر از انگلیسی (در مجموع بیش از 100) درک خواهد کرد. همانند انگلیسی، کاربران میتوانند تصاویری را که تولید میکنند با اعلانهای بعدی اصلاح کنند (مثلاً «تصویری از خرگوش خرگوش بسازید» و سپس «حالا خز را صورتی کنید»).
هوش مصنوعی هنری مولد اخیراً بسیار در سرفصل اخبار بوده است – و لزوماً به دلایل خوش بینانه نیست.
شاکیان شکایت های متعددی را علیه OpenAI و فروشندگان رقیب آن مطرح کرده اند و ادعا می کنند که داده های دارای حق چاپ – عمدتاً هنر – بدون اجازه آنها برای آموزش مدل های مولد مانند DALL-E 2 استفاده شده است. نمونه تصاویر و متن، که معمولاً بدون تفکیک از وب عمومی حذف می شوند.
از Bird پرسیدم که آیا مایکروسافت در حال بررسی راههایی برای جبران خسارت سازندگانی است که کارشان در دادههای آموزشی گنجانده شده است، حتی اگر موضع رسمی شرکت مبنی بر استفاده منصفانه باشد. پلتفرمهای متعددی که ابزارهای هوش مصنوعی مولد را راهاندازی میکنند، از جمله Shutterstock، سرمایهگذاری سازندگان را در همین راستا آغاز کردهاند. دیگران، مانند Spawning، در حال ایجاد مکانیسمهایی هستند که به هنرمندان اجازه میدهد به طور کلی از آموزش مدلهای هوش مصنوعی منصرف شوند.
برد اشاره کرد که در نهایت باید با این مسائل مقابله کرد – و سازندگان محتوا مستحق نوعی پاداش هستند. اما او حاضر نبود این هفته به هیچ چیز مشخصی متعهد شود.
جستجوی چندوجهی
در جای دیگری در جلوی تصویر، بینگ چت توانایی درک تصاویر و همچنین متن را به دست می آورد. کاربران میتوانند تصاویر را آپلود کنند و محتوای مرتبط را در وب جستجو کنند، به عنوان مثال پیوندی به تصویر یک اختاپوس قلاببافی شده را کپی کنند و از بینگ چت این سوال را بپرسند “چگونه آن را درست کنم؟” برای دریافت دستورالعمل های گام به گام
چندوجهی عملکرد بافت صفحه جدید را در برنامه Edge برای موبایل نیز تقویت می کند. کاربران میتوانند در چت بینگ درباره صفحه موبایلی که مشاهده میکنند، سؤال بپرسند.
مایکروسافت هیچ کدام را نمی گوید، اما به نظر می رسد که این توانایی های چندوجهی جدید از GPT-4 سرچشمه می گیرند، که می تواند تصاویر را علاوه بر متن درک کند. زمانی که OpenAI GPT-4 را معرفی کرد، قابلیتهای درک تصویر مدل را در دسترس همه مشتریان قرار نداد – و هنوز هم اینطور نیست. من شرط می بندم که مایکروسافت، به عنوان یک سرمایه گذار بزرگ و همکار نزدیک با OpenAI، دارای نوعی دسترسی ممتاز است.
به گفته Bird، البته از هر ابزار آپلود تصویری می توان سوء استفاده کرد، به همین دلیل است که مایکروسافت از فیلترینگ و هش خودکار برای مسدود کردن آپلودهای غیرقانونی استفاده می کند. با این حال، هیئت داوران در مورد اینکه اینها چقدر خوب کار میکنند نمیدانند – ما این فرصت را نداشتیم که خودمان آپلود تصاویر را آزمایش کنیم.
ویژگی های جدید چت
چندوجهی بودن و ویژگیهای بصری جدید همه چیزهایی نیستند که به چت بینگ میآیند.
به زودی، بینگ چت تاریخچه چت کاربران را ذخیره می کند و به آنها اجازه می دهد از جایی که کار را ترک کردند ادامه دهند و در صورت تمایل به چت های قبلی بازگردند. این تجربه ای شبیه به ویژگی تاریخچه چت است که OpenAI اخیراً به ChatGPT آورده است و لیستی از چت ها و پاسخ های ربات به هر یک از آن چت ها را نشان می دهد.
مشخصات ویژگی تاریخچه چت هنوز مشخص نشده است، مانند مدت زمانی که چت ها دقیقاً ذخیره می شوند. اما مایکروسافت میگوید کاربران میتوانند تاریخچه خود را در هر زمانی حذف کنند – با توجه به انتقاداتی که چندین دولت اتحادیه اروپا علیه ChatGPT داشتند.
Bing Chat همچنین قابلیتهای صادرات و اشتراکگذاری را به دست میآورد و به کاربران اجازه میدهد مکالمات را در رسانههای اجتماعی یا یک سند Word به اشتراک بگذارند. دنا ساندرز، شریک GM در تیم تجربیات وب مایکروسافت، به TechCrunch گفت که یک سیستم کپی و چسباندن قویتر در حال کار است – اما هنوز در پیش نمایش نیست – برای نمودارها و تصاویر ایجاد شده از طریق چت بینگ.
با این حال، شاید متحول کننده ترین افزونه به چت بینگ، افزونه ها هستند. از شرکایانی مانند OpenTable و Wolfram Alpha، افزونهها کارهایی را که Bing Chat میتواند انجام دهد را تا حد زیادی گسترش میدهند، بهعنوان مثال به کاربران کمک میکنند رزرو کنند یا تصاویری بسازند و به سوالات چالشبرانگیز علوم و ریاضی پاسخ دهند.
مانند تاریخچه چت، عملکرد افزونه ها هنوز فعال نشده است در مراحل اولیه است. هیچ بازار پلاگینی برای صحبت وجود ندارد. افزونه ها را می توان از رابط وب بینگ چت روشن یا خاموش کرد.
ساندرز اشاره کرد، اما تایید نکرد، که طرح افزونههای چت بینگ با پلاگینهای اخیراً معرفیشده OpenAI برای ChatGPT مرتبط است – یا شاید مشابه باشد. با توجه به شباهت های بین این دو، مطمئناً منطقی است.
لبه، تازه شده
بینگ چت البته از طریق Edge و همچنین وب در دسترس است. و Edge در کنار بینگ چت یک لایه رنگ تازه می گیرد.
Edge جدید و بهبود یافته برای اولین بار در فوریه پیش نمایش شد و دارای گوشه های گرد مطابق با فلسفه طراحی ویندوز 11 مایکروسافت است. همانطور که یکی از سخنگویان مایکروسافت بیان کرد، عناصر موجود در مرورگر اکنون بیشتر “کانتینری” هستند، و تغییرات ظریفی در سراسر آن وجود دارد، مانند حرکت تصویر حساب مایکروسافت در سمت چپ وسط.
در Compose، ابزار قدرتمند Bing Chat Edge که میتواند ایمیلها و غیره بنویسد (مثلاً «یک دعوتنامه برای جشن تولد سگم بنویسید»)، یک گزینه جدید به کاربران امکان میدهد طول، عبارت و لحن متن تولید شده را تنظیم کنند. تقریبا هر چیزی که دوست دارند لحن مورد نظر را تایپ کنید، و بینگ چت پیامی برای مطابقت مینویسد – برد میگوید فیلترهایی برای جلوگیری از استفاده از زنگهای آشکارا مشکلساز، مانند «نفرتآمیز» یا «نژاد پرستانه» وجود دارد.
بسیار جذابتر از Compose – حداقل برای من – اقداماتی در Edge هستند که برخی از درخواستهای Bing Chat را به خودکار تبدیل میکنند.
تایپ دستوری مانند «گذرواژههای من را از مرورگر دیگری بیاورید» در چت بینگ در نوار کناری Edge، صفحه تنظیمات دادههای مرور Edge را باز میکند، در حالی که فرمان «بازی «شیطان میپوشد پرادا» فهرستی از گزینههای پخش از جمله Vudu و (قابل پیشبینی ) فروشگاه مایکروسافت. حتی یک عمل وجود دارد که به طور خودکار برگه های مرور را سازماندهی می کند – و رنگ ها را هماهنگ می کند.
کنش ها در حال حاضر در مرحله ابتدایی هستند. اما واضح است که مایکروسافت در اینجا به کجا می رود. تصور میشود که در نهایت اقداماتی فراتر از Edge گسترش مییابد تا به سایر محصولات مایکروسافت، مانند Office 365، و شاید روزی به کل دسکتاپ ویندوز برسد.
ساندرز تایید یا تکذیب نمی کند که این پایان بازی است. او با اشاره به کنفرانس توسعه دهندگان آتی مایکروسافت به من گفت: «منتظر مایکروسافت بیلد باشید. ما باید.