آیا هوش مصنوعی میتواند از توضیحات متنی برای تولید آهنگ منسجم عقبتر عمل کند؟ این پیش فرض MusicLM است، ابزار ایجاد موسیقی مبتنی بر هوش مصنوعی که گوگل دیروز در ابتدای کنفرانس I/O خود منتشر کرد.
MusicLM که با صدها هزار ساعت صدا برای یادگیری ایجاد موسیقی جدید در طیف وسیعی از سبکها آموزش دیده است، از طریق برنامه AI Test Kitchen Google در پیش نمایش در دسترس است. من در حدود یک روز گذشته با آن بازی کرده ام، همانطور که تعدادی از همکارانم این کار را کرده اند.
حکم؟ بیایید بگوییم MusicLM به این زودی برای شغل نوازندگان نمی آید.
استفاده از MusicLM در آشپزخانه آزمایشی بسیار ساده است. هنگامی که برای دسترسی مورد تایید قرار گرفتید، با یک کادر متنی مواجه می شوید که در آن می توانید شرح آهنگ را وارد کنید – با جزئیاتی که دوست دارید – و از سیستم بخواهید دو نسخه از آهنگ را تولید کند. هر دو را میتوان برای گوش دادن آفلاین بارگیری کرد، اما Google شما را تشویق میکند تا یکی از آهنگها را “شست” کنید تا به بهبود عملکرد هوش مصنوعی کمک کنید.
وقتی برای اولین بار MusicLM را در ژانویه پوشش دادم، قبل از انتشار، نوشتم که آهنگهای این سیستم چیزی شبیه به آهنگسازی یک هنرمند انسانی است – البته نه لزوماً از نظر موسیقی مبتکرانه یا منسجم. اکنون، نمیتوانم بگویم که کاملاً روی این سخنان ایستادهام، زیرا به نظر واضح است که برداشتهای گیلاس جدی با نمونههایی از اوایل سال در جریان بوده است.
اکثر آهنگهایی که با MusicLM تولید کردهام در بهترین حالت قابل عبور هستند – و در بدترین حالت مانند یک کودک چهار ساله که در DAW آزاد میشود. من بیشتر به EDM چسبیدهام و سعی میکنم چیزی با ساختار و ملودی قابل تشخیص (به علاوه دلپذیر، در حالت ایدهآل) ارائه دهم. اما مهم نیست چقدر مناسب – حتی خوب! – شروع آهنگهای MusicLM به نظر میرسد، لحظهای فرا میرسد که آنها به شیوهای بسیار واضح و از نظر موسیقی ناخوشایند شکسته میشوند.
به عنوان مثال، این نمونه را که با استفاده از اعلان “آهنگ EDM به سبکی سبک، شاد و مطبوع، مناسب برای رقصیدن” تولید شده است، بگیرید. شروع امیدوارکننده ای است، با خط پایه و عناصر تک آهنگ کلاسیک دفت پانک. اما در اواسط مسیر، از مسیرش دور میشود – عملاً یک ژانر دیگر.
در اینجا یک تکنوازی پیانو از یک دستور ساده تر است – “موسیقی پیانو عاشقانه و احساسی”. متوجه خواهید شد که قطعات، صدا خوب و خوبی دارند – حتی استثنایی، حداقل از نظر کار انگشت. اما پس از آن گویی پیانیست دچار شیدایی می شود. درهمآمیزی نتها بعداً، و آهنگ مسیری کاملاً متفاوت به خود میگیرد، گویی از نتهای جدید – البته در امتداد خطوط اصلی.
من دست MusicLM را در چیپتونها امتحان کردم و متوجه شدم که هوش مصنوعی ممکن است با آهنگهایی با ساختار ابتداییتر کار آسانتری داشته باشد. بدون تاس. نتیجه (زیر)، در حالی که در بخشهایی جذاب بود، بهطور تصادفی مانند سایر نمونهها به پایان رسید.
از جنبه مثبت، MusicLM، در کل، کار بسیار بهتری نسبت به Jukebox انجام می دهد، تلاش OpenAI چندین سال پیش برای ایجاد یک تولید کننده موسیقی هوش مصنوعی. برخلاف MusicLM، آهنگهای Jukebox فاقد عناصر موسیقایی معمولی مانند گروههای کر که تکرار میشوند و اغلب حاوی اشعار بیمعنی هستند، نداشتند. آهنگ های تولید شده توسط MusicLM نیز حاوی مصنوعات کمتری هستند و به طور کلی در مورد وفاداری یک پله به نظر می رسند.
ظهور Dance Diffusion چندین سال پس از آن اتفاق افتاد که OpenAI، آزمایشگاه مستقر در سانفرانسیسکو در پشت DALL-E 2، آزمایش بزرگ خود را با تولید موسیقی به نام Jukebox شرح داد. با توجه به ژانر، هنرمند و تکهای از اشعار، جوک باکس میتواند موسیقی نسبتاً منسجمی همراه با آواز تولید کند. اما آهنگهایی که جوکباکس تولید میکند فاقد ساختارهای موسیقایی بزرگتر مانند گروههای کر که تکرار میشوند و اغلب حاوی اشعار بیمعنی هستند.
سودمندی MusicLM علاوه بر این، به لطف محدودیتهای مصنوعی در سمت درخواست، کمی محدود است. این موسیقی با هنرمندان یا آوازها، حتی در آن، تولید نمی کند سبک از نوازندگان خاص سعی کنید دستوری مانند “در امتداد خطوط Barry Manilow” را تایپ کنید و چیزی جز یک پیام خطا دریافت نخواهید کرد.
دلیل احتمالا قانونی است به هر حال، موسیقی Deepfaked در زمینه قانونی مبهم قرار دارد و برخی در صنعت موسیقی استدلال میکنند که تولیدکنندگان موسیقی هوش مصنوعی مانند MusicLM حق چاپ موسیقی را نقض میکنند. ممکن است مدت زیادی طول نکشید که تا حدودی شفافیت در این مورد وجود داشته باشد – چندین دعوی قضایی که در دادگاه ها به راه می افتد احتمالاً بر هوش مصنوعی تولید کننده موسیقی تأثیر خواهد داشت، از جمله یکی از موارد مربوط به حقوق هنرمندانی که کارشان برای آموزش سیستم های هوش مصنوعی بدون استفاده از آنها استفاده می شود. علم یا رضایت زمان نشان خواهد داد.