از زمانی که OpenAI در سال گذشته از ChatGPT رونمایی کرد، تقریباً غیرممکن است که یک روز بدون شرکت یا توسعهدهندهای که ابزار مبتنی بر هوش مصنوعی را منتشر کند، بگذرد. اکنون، با عرضه مدلهای جدیدی مانند GPT-4 OpenAI و Claude Anthroipic، سازندگان اپلیکیشنهای بیشتری در حال تلاش برای یافتن ابزارهایی هستند که برای مردم در دسترستر و مفیدتر هستند.
برخی از برنامه ها تجربه بومی موبایل یا دسکتاپ را ارائه می دهند که به افراد امکان می دهد با چت ربات های مجهز به هوش مصنوعی خارج از مرورگر وب صحبت کنند. ایده اصلی آنها کسب درآمد از طریق باز کردن قفل دسترسی نامحدود به این ربات ها و ارائه برخی ایده های سریع به کاربران است.
با این حال، برخی از توسعه دهندگان می خواهند یک قدم فراتر بروند و در حال کار روی یکپارچه سازی بهتر برنامه های خود با سیستم هستند. قبلاً چندین تلاش برای سازگار کردن این برنامه ها با سیری از طریق Shortcuts صورت گرفته است. بنابراین کاربران می توانند سوالات خود را از طریق صدا یا حتی متن از ChatGPT (یا هر مدل دیگری) بپرسند. این به آنها مزیتی می دهد در مواردی که سیری نمی تواند پرس و جوی کاربر را بفهمد، آنها فقط می توانند از صفحه کلید برای تایپ سوال برای ربات مجهز به هوش مصنوعی استفاده کنند.
یکی از نمونه ها Short Circuit است، اپلیکیشنی که توسط آن ساخته شده است جو فابیسویچ، یک کارمند سابق توییتر به توسعه دهنده مستقل تبدیل شد. این برنامه به شما امکان می دهد با رباتی به نام Shorty چت کنید. همراه با اعلانهای پیشنهادی برای برنامههای تمرینی، برنامههای غذایی، نوشتن آهنگهای خندهدار، و کشف حقایق سرگرمکننده درباره یک موضوع است. همچنین به شما امکان می دهد از فرمان «Hey Siri, Hey Shorty» برای پرسیدن سؤالات از طریق صدا استفاده کنید.
فابیسویچ گفت که این ابزارها به او کمک کردند تا توضیحی در اپ استور بنویسد، پیشنهادات بهینهسازی اپ استور را بنویسد و کد خرید اپلیکیشن بنویسد. او اضافه کرد که تیم توسعه دهنده Short Circuit در حال بررسی راه هایی برای ادغام برنامه با انواع اتوماسیون با استفاده از Shortcuts است.
کاربران MacStories برای توسعه میانبری به نام S-GPT که در بسیاری از بخشهای macOS و iOS ادغام شده است، قدمی فراتر گذاشتهاند.
این ابزار می تواند یک صفحه وب به اشتراک گذاشته شده از طریق برگه اشتراک سافاری را خلاصه کند. میتواند به مدیریت زمان کمک کند تا بفهمیم در چه روزهایی برنامهای فشرده دارید. متن موجود در کلیپ بورد خود را برای اشتباهات گرامری بررسی کنید. و پیشنهاد باز کردن پیوندها از پاسخ ChatGPT در چندین تب Safari.
اما ویژگی که بیشتر از همه به دلیل فاکتور سرگرم کننده اش برجسته می شود این است که می توانید از S-GPT بخواهید یک لیست پخش بر اساس یک درخواست ایجاد کند. به عنوان مثال، هنگامی که از شما میپرسید «یک لیست پخش با 15 آهنگ راک از اوایل دهه 2000 برای من بساز»، این لیست در Apple Music ذخیره میشود. ابزارهایی مانند PlaylistAI ویژگی هایی مانند تولید لیست پخش را از طریق درخواست Spotify منتشر کرده اند. اما تلاش S-GPT با توجه به اینکه از Apple Music استفاده می کند، یکپارچه تر به نظر می رسد.
فدریکو ویتیچی از MacStories اشاره میکند که میتوانید پرسوجوهای پیچیدهای مانند «برای من یک لیست پخش با 25 آهنگ دلپذیر راک مستقل که بین سالهای 2000 و 2010 منتشر شدهاند، وارد کنید و آنها را بر اساس سال انتشار، از قدیمیترین تا جدیدترین» مرتب کنید.
توسعه دهندگان همچنین ادعا می کنند که S-GPT بهتر از سیری در مورد مکالمات رفت و برگشتی است. دلیلش این است که این ابزار از شما میخواهد در صورت تمایل سؤالات بعدی بپرسید. داشتن یک اعلان بصری در برخی موارد کمک می کند، زیرا سیری اغلب زمینه گفتگو را فراموش می کند.
هم توسعه دهندگان S-GPT و هم Short Circuit اشاره می کنند که سیری اغلب متن طولانی را از منبعی مانند ویکی پدیا می خواند که ممکن است خسته کننده باشد. آنها استدلال می کنند که خواندن متن کمی طولانی تر روی صفحه آسان تر است.
مدلهای مجهز به GPT در مواردی که مجبورند متن تولید کنند، متن را خلاصه کنند و اطلاعات بیشتری در مورد موضوع از منابع متعدد ارائه کنند، مفیدتر از سیری هستند. فابیسویچ از طریق ایمیل گفت که بهترین مزیت این مدلهای زبانی بزرگ این است که چگونه «حلقه جستجوی چندگانه Google» را کاهش میدهند.
او گفت که کاربران اتصال کوتاه موارد استفاده از برنامه ریزی غذا گرفته تا یافتن اطلاعات بیشتر در مورد پرنده در حین پرنده نگری، مشکلات کدگذاری، و تولید داستان های Dungeons & Dragons را پیدا کرده اند.
با این حال، وقتی نوبت به کشف حقایقی مانند شرایط آب و هوایی فردا یا امتیاز آخرین مسابقه می رسد، سیری (یا هر دستیار مشابه) همچنان برتر است. فابیسویچ گفت که به همین دلیل یک دکمه بررسی واقعیت در برنامه وجود دارد که شما را به صفحه نتایج جستجوی Google با پاسخ به عنوان پرس و جو می برد.
من هنوز به نتایجی که ChatGPT به من میدهد اعتماد ندارم و خودم را در حال بررسی واقعیت اطلاعاتی میبینم که غیرواقعی یا مشکوک به نظر میرسند. گاهی اوقات شهود من اشتباه است و ChatGPT درست است، اما این شک و تردید چیزی است که من را به ایجاد یک ویژگی بررسی واقعیت در مدار کوتاه. اگرچه GPT-4 با توهم بهتر است، من هنوز فکر می کنم که توهم برای مدل های زبان بزرگ مشکل بزرگی خواهد بود.
حتی بینگ مایکروسافت و بارد گوگل نیز معمولاً وقتی در مورد رویدادهای جاری یا رویدادهای تاریخی سؤال میشوند شکست میخورند. بنابراین از این نظر، دستیارهای نسل فعلی هوش مصنوعی در تلفنها کمتر مستعد انتشار اطلاعات نادرست هستند، زیرا اگر از موضوعی اطلاعی نداشته باشند، صرفاً شما را به جستجوی وب هدایت میکنند. رباتهای چت هوش مصنوعی همچنین از سرعت کم برخوردار هستند زیرا برای دریافت پاسخ به یک پرس و جو نیاز به پرس و جو از یک سرور (مانند OpenAI) دارند.
این موج اول ربات های مجهز به GPT دقیقاً در تلاش برای جایگزینی سیری نیستند. اما وقتی صحبت از درخواست پیشنهادات یا ایدهها میشود، سعی میکنند زندگی را آسانتر کنند. جدا از موارد ذکر شده، ابزارهایی مانند AnyGPT و MacGPT دسترسی آسان به ChatGPT را در Mac آسانتر میکنند، اما چیزهایی مانند یکپارچهسازی فرمان صوتی را ارائه نمیکنند.
با توجه به اینکه گوگل و اپل کنفرانس های سالانه توسعه دهندگان خود را در چند ماه آینده برگزار می کنند، جالب است که ببینیم چگونه دستیاران خود را به روز می کنند. طبق گزارشها، چندین تیم در اپل – از جمله تیمی که Siri را مدیریت میکند – در حال آزمایش مدلهای زبان بزرگ هستند.
به طور همزمان، توسعه دهندگان امیدوارند برای استفاده از این مدل های زبان بزرگ، به اتوماسیون بیشتر در سطح سیستم دسترسی داشته باشند. تحلیلهای اخیر از چندین شرکت نشان میدهد که هم دانلودها و هم هزینه مصرفکنندگان برای اپلیکیشنهای مبتنی بر هوش مصنوعی در چند ماه گذشته به شدت افزایش یافته است. بنابراین توسعه دهندگان می خواهند از این موج هوش مصنوعی مولد پول نقد کنند.