با مولد موسیقی گوگل با هوش مصنوعی همکاری کنید

آیا هوش مصنوعی می‌تواند از توضیحات متنی برای تولید آهنگ منسجم عقب‌تر عمل کند؟ این پیش فرض MusicLM است، ابزار ایجاد موسیقی مبتنی بر هوش مصنوعی که گوگل دیروز در ابتدای کنفرانس I/O خود منتشر کرد.

MusicLM که با صدها هزار ساعت صدا برای یادگیری ایجاد موسیقی جدید در طیف وسیعی از سبک‌ها آموزش دیده است، از طریق برنامه AI Test Kitchen Google در پیش نمایش در دسترس است. من در حدود یک روز گذشته با آن بازی کرده ام، همانطور که تعدادی از همکارانم این کار را کرده اند.

حکم؟ بیایید بگوییم MusicLM به این زودی برای شغل نوازندگان نمی آید.

استفاده از MusicLM در آشپزخانه آزمایشی بسیار ساده است. هنگامی که برای دسترسی مورد تایید قرار گرفتید، با یک کادر متنی مواجه می شوید که در آن می توانید شرح آهنگ را وارد کنید – با جزئیاتی که دوست دارید – و از سیستم بخواهید دو نسخه از آهنگ را تولید کند. هر دو را می‌توان برای گوش دادن آفلاین بارگیری کرد، اما Google شما را تشویق می‌کند تا یکی از آهنگ‌ها را “شست” کنید تا به بهبود عملکرد هوش مصنوعی کمک کنید.

MusicLM

اعتبار تصویر: گوگل

وقتی برای اولین بار MusicLM را در ژانویه پوشش دادم، قبل از انتشار، نوشتم که آهنگ‌های این سیستم چیزی شبیه به آهنگسازی یک هنرمند انسانی است – البته نه لزوماً از نظر موسیقی مبتکرانه یا منسجم. اکنون، نمی‌توانم بگویم که کاملاً روی این سخنان ایستاده‌ام، زیرا به نظر واضح است که برداشت‌های گیلاس جدی با نمونه‌هایی از اوایل سال در جریان بوده است.

اکثر آهنگ‌هایی که با MusicLM تولید کرده‌ام در بهترین حالت قابل عبور هستند – و در بدترین حالت مانند یک کودک چهار ساله که در DAW آزاد می‌شود. من بیشتر به EDM چسبیده‌ام و سعی می‌کنم چیزی با ساختار و ملودی قابل تشخیص (به علاوه دلپذیر، در حالت ایده‌آل) ارائه دهم. اما مهم نیست چقدر مناسب – حتی خوب! – شروع آهنگ‌های MusicLM به نظر می‌رسد، لحظه‌ای فرا می‌رسد که آنها به شیوه‌ای بسیار واضح و از نظر موسیقی ناخوشایند شکسته می‌شوند.

به عنوان مثال، این نمونه را که با استفاده از اعلان “آهنگ EDM به سبکی سبک، شاد و مطبوع، مناسب برای رقصیدن” تولید شده است، بگیرید. شروع امیدوارکننده ای است، با خط پایه و عناصر تک آهنگ کلاسیک دفت پانک. اما در اواسط مسیر، از مسیرش دور می‌شود – عملاً یک ژانر دیگر.


در اینجا یک تکنوازی پیانو از یک دستور ساده تر است – “موسیقی پیانو عاشقانه و احساسی”. متوجه خواهید شد که قطعات، صدا خوب و خوبی دارند – حتی استثنایی، حداقل از نظر کار انگشت. اما پس از آن گویی پیانیست دچار شیدایی می شود. درهم‌آمیزی نت‌ها بعداً، و آهنگ مسیری کاملاً متفاوت به خود می‌گیرد، گویی از نت‌های جدید – البته در امتداد خطوط اصلی.

من دست MusicLM را در چیپ‌تون‌ها امتحان کردم و متوجه شدم که هوش مصنوعی ممکن است با آهنگ‌هایی با ساختار ابتدایی‌تر کار آسان‌تری داشته باشد. بدون تاس. نتیجه (زیر)، در حالی که در بخش‌هایی جذاب بود، به‌طور تصادفی مانند سایر نمونه‌ها به پایان رسید.

از جنبه مثبت، MusicLM، در کل، کار بسیار بهتری نسبت به Jukebox انجام می دهد، تلاش OpenAI چندین سال پیش برای ایجاد یک تولید کننده موسیقی هوش مصنوعی. برخلاف MusicLM، آهنگ‌های Jukebox فاقد عناصر موسیقایی معمولی مانند گروه‌های کر که تکرار می‌شوند و اغلب حاوی اشعار بی‌معنی هستند، نداشتند. آهنگ های تولید شده توسط MusicLM نیز حاوی مصنوعات کمتری هستند و به طور کلی در مورد وفاداری یک پله به نظر می رسند.

ظهور Dance Diffusion چندین سال پس از آن اتفاق افتاد که OpenAI، آزمایشگاه مستقر در سانفرانسیسکو در پشت DALL-E 2، آزمایش بزرگ خود را با تولید موسیقی به نام Jukebox شرح داد. با توجه به ژانر، هنرمند و تکه‌ای از اشعار، جوک باکس می‌تواند موسیقی نسبتاً منسجمی همراه با آواز تولید کند. اما آهنگ‌هایی که جوک‌باکس تولید می‌کند فاقد ساختارهای موسیقایی بزرگ‌تر مانند گروه‌های کر که تکرار می‌شوند و اغلب حاوی اشعار بی‌معنی هستند.

سودمندی MusicLM علاوه بر این، به لطف محدودیت‌های مصنوعی در سمت درخواست، کمی محدود است. این موسیقی با هنرمندان یا آوازها، حتی در آن، تولید نمی کند سبک از نوازندگان خاص سعی کنید دستوری مانند “در امتداد خطوط Barry Manilow” را تایپ کنید و چیزی جز یک پیام خطا دریافت نخواهید کرد.

MusicLM

اعتبار تصویر: گوگل

دلیل احتمالا قانونی است به هر حال، موسیقی Deepfaked در زمینه قانونی مبهم قرار دارد و برخی در صنعت موسیقی استدلال می‌کنند که تولیدکنندگان موسیقی هوش مصنوعی مانند MusicLM حق چاپ موسیقی را نقض می‌کنند. ممکن است مدت زیادی طول نکشید که تا حدودی شفافیت در این مورد وجود داشته باشد – چندین دعوی قضایی که در دادگاه ها به راه می افتد احتمالاً بر هوش مصنوعی تولید کننده موسیقی تأثیر خواهد داشت، از جمله یکی از موارد مربوط به حقوق هنرمندانی که کارشان برای آموزش سیستم های هوش مصنوعی بدون استفاده از آنها استفاده می شود. علم یا رضایت زمان نشان خواهد داد.

در حال حاضر، هر چند، من استدلال می کنم که هنرمندان دلیل زیادی برای نگرانی ندارند. MusicLM، مانند سایر تولیدکننده‌های موسیقی هوش مصنوعی که اخیراً منتشر شده‌اند، بیش از هر چیز نشان‌دهنده این است که این فناوری چقدر باید پیش برود.

درباره Google I/O 2023 در TechCrunch بیشتر بخوانید