Dumme، استارتآپی که هوش مصنوعی را در ویرایش ویدیو به کار میگیرد، پیش از اینکه به روی عموم باز شود، تقاضا ایجاد کرده است. شرکت تحت حمایت Y Combinator صدها سازنده ویدیو دارد که محصولش را آزمایش میکنند، که از هوش مصنوعی برای ایجاد ویدیوهای کوتاه از محتوای YouTube استفاده میکند و فهرست انتظاری با بیش از 20000 فیلم قبل از راهاندازی. با استفاده از ترکیبی از هر دو مدل اختصاصی و موجود هوش مصنوعی، وعده Dumme این است که نه تنها میتواند در زمان ویرایش صرفهجویی کند، بلکه – و این ادعای بزرگ آن است – کار بهتری نسبت به نیروی کار قراردادی (انسانی) انجام میدهد که معمولاً وظیفهی ضعیفتری دارند. کارهای ویرایش ویدیو، مانند کاهش محتوای طولانی برای انتشار در پلتفرم های کوتاه مانند YouTube Shorts، TikTok یا Instagram Reels.
مروان درای بنیانگذار و مدیر عامل Dumme که در ژانویه 2022 تأسیس شد و یکی از شرکتکنندگان در برنامه شتابدهنده استارتآپ Y Combinator’s Winter 2022 بود، گفت که در ابتدا روی ساخت یک موتور جستجو برای ویدیو متمرکز بود. اما حدود شش ماه پیش، تیم متوجه شد که یک محصول بهتر ممکن است استفاده مجدد از همان مدلهای هوش مصنوعی باشد که در حال توسعه برای ویرایش کلیپهای ویدیویی بودند.
ویل دالستروم (CPO) و جردن برانان (CTO) که همگی دارای پیشینه هوش مصنوعی هستند، درای متوجه شد که Dumme ممکن است پس از ویروسی شدن برنامه آنها در بازار محصول مناسبی پیدا کرده باشد و سرورهای آنها را خراب کند.
درای توضیح میدهد: «ما واقعاً انتظار نداشتیم که کشش زیادی یا هر چیز دیگری داشته باشد، بنابراین فقط چیزی را در آنجا قرار دادیم. “سپس اتفاقی که افتاد این بود که یک شبه، ما با سرورهای پربار از خواب بیدار شدیم – مثل اینکه هیچ چیز واقعاً کار نکرد. بنابراین ما همه چیز را حذف کردیم و در واقع نوعی لیست انتظار را جمع آوری کردیم. صبح روز بعد، احتمالاً 5000 نفر در آنجا بیدار شدیم، که جالب بود.
تیم بعداً متوجه شد که یکی از خالقان TikTok ویدیوی کوتاهی در مورد این محصول ارسال کرده است که سیل ترافیکی را به سایت آنها فرستاد.
درای خاطرنشان می کند: «در واقع هرگز از آن آرام نشد.
این محصول که «دوممی» تلفظ میشود، برای سازندگان جذابیت داشت، زیرا هدف آن سادهسازی و سرعت بخشیدن به کار مربوط به ویرایش ویدیو بود.
استفاده از Dumme همانطور که از نامش پیداست ساده است. برای شروع، کاربر پیوند یک ویدیوی یوتیوب را جایگذاری میکند، سپس روی «تولید» کلیک میکند و هوش مصنوعی تعدادی ویدیوی کوتاه را به نمایش میگذارد که نکات برجسته آن محتوای دریافتشده را به نمایش میگذارد. این شرکت میگوید از یوتیوب بهعنوان منبع استفاده میکند، بهجای پشتیبانی از فیلمهای ویدئویی خام، به منظور برونسپاری تعدیل محتوا – یعنی اگر در YouTube مجاز است، در Dumme مجاز است.
زمان پردازش و تعداد کلیپ های حاصل به طول ویدیوی اصلی بستگی دارد.
اما بهعنوان مثال، پردازش یک پادکست ویدیویی یک ساعته ممکن است حدود 20 دقیقه طول بکشد و بعد از حدود پنج دقیقه شروع به دریافت کلیپها خواهید کرد. پس از تکمیل، سازندگان میتوانند کلیپهای ویدیویی را که بهطور پیشفرض کمتر از 60 ثانیه هستند دانلود کرده و آنها را در هر پلتفرمی که از محتوای کوتاهمدت پشتیبانی میکند، مانند YouTube Shorts، و همچنین پلتفرمهای دیگر، مانند Reels یا TikTok، آپلود کنند.
این که چگونه این همه در backend کار می کند، البته بسیار پیچیده تر است. این شرکت میگوید که در ابتدا Dumme تا جایی که بتواند از ویدیوی منبع از طریق ابرداده یاد میگیرد. سپس ویدیو را رونویسی میکند و سعی میکند معنایی را که گفته میشود درک کند، در حالی که به فریمها نگاه میکند تا سعی کند احساسات فردی را که صحبت میکند رمزگشایی کند. این یافتهها با هم مرتبط هستند و به یک مدل زبانی منتقل میشوند که تلاش میکند تعیین کند چه بخشهایی از ویدیو ارزش برش را دارند. سپس به مدل دیگری که بلندگوهای فعال را ردیابی می کند و برش را کنترل می کند، واگذار می شود.
Dumme میگوید که با مدلهای موجود هوش مصنوعی مانند GPT-4، یک نسخه تنظیمشده دقیق از Whisper، و سایر مدلهایی که در داخل خود ساخته است، کار میکند – مانند مدلی که بلندگوهای فعال را در یک قاب ویدیو ردیابی میکند. یکی از مدلهای آن نیز روی دستهای از شورتهای یوتیوب آموزش دیده است تا بیاموزد که چه چیزی باعث ایجاد یک قلاب باز خوب برای جذب بینندگان میشود. برای درک بهتر زمینه ویدیو
این شرکت به ما میگوید که کار هوش مصنوعی بر روی CoreWeave ارائهدهنده GPU Cloud انجام میشود، نه AWS، زیرا مقرون به صرفهتر است.
از آنجایی که Dumme به هوش مصنوعی متکی است که کلمات گفته شده را پردازش می کند، این فناوری برای مواردی مانند ویدیوهای گیم پلی طولانی یا مواردی که مردم در آن صحبت نمی کنند مناسب نیست. Drai میگوید این استارتآپ در ابتدا سازندگان، پادکستها و آژانسهای یوتیوب را هدف قرار میدهد – آنها معتقدند که دومی بهترین گزینه برای کسب درآمد از محصول است.
درای توضیح میدهد که آژانسها امروزه اغلب این نوع کارها را با نتایجی برونسپاری میکنند.
“آنها فقط به پیمانکاران در حوزه های قضایی ارزان قیمت می دهند تا محتوای خود را ویرایش کنند. و مشکل این است که هنوز در واقع بسیار گران است و زمان زیادی را صرف می کند – هفته ها طول می کشد، نه چند دقیقه.
دری در پاسخ به این سوال که در مورد ایجاد فناوری که در واقع مردم را بیکار می کند چه احساسی دارد، نگران نبود.
طرز فکر من در مورد آن این است که، در نهایت … فکر می کنم این مانند این است که به من بگویید معلمان ریاضی می خواهند [be put] بیکار چون چیزی به نام ماشین حساب وجود دارد…» او توضیح می دهد. «مردم قرار است خود را وفق دهند. و سپس کسی در مورد ماشین حساب به شما آموزش می دهد، درست است؟ بنابراین من فکر میکنم که فقط مسئله سازگاری با این موضوع است.» درای میگوید.
در حال حاضر، قیمتهایی که در نظر گرفته میشوند شامل سطوحی است که یک کسبوکار باید 0.40 دلار به ازای هر دقیقه ویدیوی پردازش شده بپردازد، در حالی که سازندگان کوچکتر ممکن است اشتراک ماهانهای را انتخاب کنند که حداکثر 10 ساعت محتوا در ماه است. (این اعداد ممکن است تغییر کنند.) در طول آزمایش، استفاده از محصول رایگان بوده است.
پذیرندگان اولیه از Dumme برای ویرایشهای مختلف استفاده میکردند، از جمله تولید کلیپهایی از پادکستهای ویدیویی خود برای انتشار در Shorts، و همچنین کاهش سایر ویدیوهای جدید و مرور کاتالوگهای پشتیبان آنها.
به نظر می رسد این محصول با سایر فناوری های هوش مصنوعی موجود در بازار رقابت کند، از جمله فناوری ساخت شرکت Jellysmack، که از هوش مصنوعی برای تبدیل ویدیوهای طولانی تر YouTube به ویدیوهای کوتاه تر، با برش، تغییر اندازه و بهینه سازی آنها برای پلتفرم های خاص استفاده می کند. نتیجه خرید کاموا در سال 2021. ابزارهای دیگری که کارهای مشابه را انجام می دهند شامل مواردی مانند Opus Clip، Vidyo.ai، Detail، TubeBuddy، Wisecut و موارد دیگر است. اینکه Dumme تا چه اندازه موفق یا شکست میخورد، به عملکرد بهتر از رقبا در کیفیت کار و هزینه بستگی دارد – معیارهایی که هنوز مشخص نشدهاند.
اما برخی از سرمایه گذاران شرط های خود را روی Dumme قرار می دهند. قبل از راهاندازی، این استارتآپ سرمایه ۳.۴ میلیون دلاری را از Y Combinator، Caffeinated Capital، Max و Nellie Levchin (از طریق SciFi VC)، سهیل دوشی، نیکو چینوت، Protocol Labs، Chris Puscasiu و دیگر فرشتگان جمعآوری کرد.
با توجه به علاقه و لیست انتظار قابل توجه، Dumme می گوید که قصد دارد هر هفته حدود 500 نفر را سوار کند. خوانندگان TechCrunch میتوانند با استفاده از کد دعوت TECHCRUNCH تا زمانی که شکافها تمام شود، از خط عبور کنند.