امروزه، بسیاری از مردم مشغول استفاده از ابزارهای هوش مصنوعی تبدیل متن به عکس هستند. بااینحال، ابزارهای تبدیل متن به ویدئو هنوز بهصورت گسترده از راه نرسیدهاند. چنین سیستمهایی به شما امکان میدهند صحنهی مدنظر خود را در قالب متن توصیف و نتیجه را بهصورت ویدئو از هوش مصنوعی دریافت کنید.
استارتاپی به نام Runway ابزار هوش مصنوعی جدیدی معرفی کرده است که رؤیای تولید ویدئو براساس متن را محقق میکند.
Runway ابزاری مبتنیبر وب دارد که مخصوص ویرایش فایلهای ویدئویی است و میتواند کارهایی مثل حذف پسزمینه را انجام دهد. این شرکت به توسعهی مدل هوش مصنوعی متنباز Stable Diffusion کمک کرد و ماه گذشته سراغ رونمایی اولین مدل هوش مصنوعی برای ویرایش ویدئو با نام Gen-1 رفت.
ابزار Gen-1 روی ویرایش فایلهای ویدئویی ضبطشده تمرکز دارد و به کاربران امکان میدهد انیمیشن سهبعدی یا ویدئو ضبطشده با گوشی را ازطریق هوش مصنوعی اصلاح کنند. برای نمونه، در تصویر بالا ویدئو ضبطشده از یک مقوا و چند آیتم دیگر با تصویر کارخانهای صنعتی ترکیب شده است.
ابزار جدید Gen-2 روی تولید ویدئو متمرکز است؛ البته این ابزار فعلاً نقصهایی دارد؛ مثلاً کلیپهای منتشرشدهی استارتاپ Runway بسیار کوتاه و ناپایدار و غیرواقعیاند و دسترسی به این ابزار نیز محدود است.
بهگزارش ورج، کاربران موظفاند برای حضور در فهرست انتظار ثبتنام کنند. سخنگوی Runway به ورج گفته است که ابزار هوش مصنوعی جدید در هفتههای آینده بهصورت گسترده دردسترس میگیرد.
با وجود تمامی نقصها، ویدئوهایی که هوش مصنوعی Gen-2 صرفاً از روی متن میسازد، شگفتانگیزند؛ البته ابزارهای تبدیل متن به ویدئو در عین جذاببودن، میتوانند نشر اخبار جعلی را افزایش دهند.
این نخستینباری نیست که ابزارهای تبدیل متن به ویدئو را میبینیم؛ زیرا متا و گوگل نیز پیشتر چنین ابزارهایی را بهنمایش گذاشتهاند. آنچه این دو شرکت نمایش دادند، شامل ویدئوهایی طولانیتر و منسجمتر بود. فراموش نکنید گوگل و متا کارمندان پرتعدادی دارند؛ اما استارتاپ Runway شامل تیمی ۴۵ نفره است.