Project Starline جالبترین تماس کاری است که تا به حال انجام داده اید

من ندارم هر تصویری از تجربه پروژه Starline من. گوگل یک خط مشی سختگیرانه «بدون عکس، بدون ویدیو» در نظر گرفته بود. بدون همکار. فقط من در یک اتاق جلسه تاریک در محوطه آمفی تئاتر Shoreline در Mountain View. وارد می شوی و جلوی یک میز می نشینی. در مقابل شما چیزی است که شبیه یک تلویزیون صفحه تخت و بزرگ است.

لبی زیر صفحه نمایش به صورت یک قوس به بیرون کشیده شده است که در یک بلندگو قرار دارد. سه ماژول دوربین در لبه های صفحه نمایش وجود دارد – در بالا و دو طرف. آنها کمی شبیه Kinects به نظر می رسند به طوری که به نظر می رسد همه دوربین های استریوسکوپی مدرن هستند.

جلسه هفت دقیقه ای بسیار کوتاه در واقع یک مصاحبه است. هنگامی که فوکوس تصویر واضح‌تر می‌شود، یک شکل نرم و تار وارد کادر می‌شود و می‌نشیند. به نظر می رسد که هم یک تنظیم حریم خصوصی است و هم فرصتی برای سیستم برای کالیبره کردن موضوع خود. یکی از تفاوت های کلیدی بین این نمونه اولیه پروژه استارلاین و نمونه ای که گوگل در اواخر سال گذشته به نمایش گذاشت، کاهش چشمگیر سخت افزار است.

این تیم تعداد دوربین‌ها را از «چند» به چند دوربین کاهش داده و اندازه کلی سیستم را از چیزی شبیه به یکی از آن غرفه‌های غذاخوری به‌طور چشمگیری کاهش داده است. ترفند در اینجا ایجاد یک مدل سه بعدی بلادرنگ از یک فرد با زاویه دوربین بسیار کمتر است. اینجاست که هوش مصنوعی و ML وارد عمل می‌شوند و شکاف‌های داده را پر می‌کنند، نه کاملاً متفاوت با روشی که پیکسل با ابزارهایی مانند Magic Erase به پس‌زمینه‌ها تقریب می‌کند – البته با رندر سه‌بعدی.

بعد از اینکه موضوع مصاحبه من – یکی از اعضای تیم پروژه استارلاین – ظاهر شد، کمی زمان می برد تا چشم و مغز خود را تنظیم کنند. این یک هولوگرام متقاعدکننده است – مخصوصاً برای رندرهایی که در زمان واقعی ارائه می‌شوند، تقریباً با همان تأخیری که در یک تماس ساده زوم دو بعدی قدیمی تجربه می‌کنید.

شما متوجه چیزی خواهید شد که کمی… خاموش است. انسان ها معمولاً سخت ترین هستند. ما طی هزاران سال تکامل یافته ایم تا کوچکترین انحراف از هنجار را شناسایی کنیم. من اصطلاح “انقباض” را برای توصیف حرکت ظریف روی بخش‌هایی از پوست سوژه کنار می‌گذارم. او – دقیق تر – آنها را “مصنوعات” می نامد. اینها نمونه‌های کوچکی هستند که سیستم به احتمال زیاد به دلیل محدودیت‌هایی که در داده‌های جمع‌آوری‌شده توسط حسگرهای درون‌برد وجود دارد، کاملاً ثابت نشده است. این شامل بخش‌هایی با فقدان اطلاعات بصری می‌شود، که به نظر می‌رسد هنرمند از رنگ کوتاهی برخوردار است.

بسیاری از سطح راحتی شخصی شما به تطبیق با این ارائه جدید اطلاعات دیجیتالی بستگی دارد. به طور کلی، زمانی که بیشتر ما با شخص دیگری صحبت می کنیم، کل مکالمه را صرف شکل فیزیکی او نمی کنیم. شما روی کلمات تمرکز می‌کنید و اگر با چنین چیزهایی هماهنگ هستید، نشانه‌های فیزیکی ظریفی که در طول راه از بین می‌بریم. احتمالاً هر چه بیشتر از سیستم استفاده کنید، مغز شما به کالیبراسیون کمتری نیاز دارد.

به نقل از یک نشریه تحقیقاتی گوگل در مورد این فناوری:

سیستم ما به نشانه‌های سه بعدی سمعی و بصری کلیدی (استریوپسیس، اختلاف منظر حرکتی و صدای فضایی) دست می‌یابد و طیف کاملی از نشانه‌های ارتباطی (تماس چشمی، حرکات دست و زبان بدن) را فعال می‌کند، اما نیازی به عینک یا میکروفون/هدفون مخصوص بدن ندارد. . این سیستم متشکل از یک نمایشگر اتوسترئوسکوپی با ردیابی سر، زیرسیستم‌های تصویربرداری و رندر سه بعدی با وضوح بالا و انتقال شبکه با استفاده از رنگ‌های فشرده و جریان‌های ویدئویی عمقی است. کمک‌های دیگر عبارتند از الگوریتم ترکیبی هندسه مبتنی بر تصویر، قطع صدا در فضای آزاد، و محلی‌سازی سخنگو.

در واقع، پروژه استارلاین با استفاده از دو دوربین بیولوژیکی با فاصله در جمجمه، اطلاعات را جمع‌آوری می‌کند و به گونه‌ای ارائه می‌کند که درک عمق (stereopsis) ایجاد کند. در همین حال، صدای فضایی عملکرد مشابهی را برای صدا انجام می دهد و بلندگوها را کالیبره می کند تا این تصور را ایجاد کند که صدای گوینده از دهان مجازی آنها خارج می شود.

گوگل مدتی است که این نسخه اولیه خاص را با WeWork، T-Mobile و Salesforce آزمایش می‌کند – احتمالاً مشتریان شرکت‌های بزرگی که به چنین چیزی علاقه دارند. این شرکت می‌گوید بسیاری از بازخوردها حول این موضوع است که چقدر این تجربه نسبت به چیزهایی مانند Google Meet، Zoom و Webex صحت دارد – پلتفرم‌هایی که در طول همه‌گیری همه‌گیر تهوع ما را نجات دادند، اما همچنان محدودیت‌های زیادی دارند.

احتمالاً شنیده‌اید که مردم شکایت می‌کنند – یا خودتان شکایت کرده‌اید – در مورد چیزهایی که وقتی از جلسه حضوری به فضای مجازی رفتیم از دست دادیم. این یک احساس عینی واقعی است. بدیهی است که Project Starline هنوز یک تجربه مجازی است، اما احتمالاً می تواند مغز شما را فریب دهد تا خلاف آن را باور کند. به خاطر یک جلسه در محل کار، رک و پوست کنده احتمالاً بیش از اندازه کافی است.

اینجا هیچ جدول زمانی و قیمتی وجود ندارد. گوگل در جلسه ما از آن به عنوان “پروژه فناوری” یاد کرد. احتمالاً نتیجه ایده آل برای تمام زمان و هزینه ای که برای چنین پروژه ای صرف می شود، یک محصول قابل فروش است. اندازه نهایی و قیمت احتمالی تقریباً مطمئناً برای بسیاری از ما دور از دسترس خواهد بود. من می‌توانم نسخه ماژولارتری از سیستم دوربین را ببینم که به کنار تلویزیون یا رایانه متصل می‌شود و عملکرد خوبی دارد.

برای اکثر افراد در بیشتر موقعیت‌ها، در شکل فعلی‌اش بیش از حد است، اما به راحتی می‌توان فهمید که چگونه گوگل می‌تواند به آینده کنفرانس از راه دور اشاره کند. مطمئناً کارفرمایان شما را شکست می دهد و باعث می شود که در یک متاورس ناتمام تماس بگیرید.

درباره Google I/O 2023 در TechCrunch بیشتر بخوانید