
OpenAI تكشف النقاب عن Sora، وهو نموذج ذكاء اصطناعي مبتكر لتحويل النص إلى فيديو > في العام الماضي، ظهرت سلسلة من محركات تحويل النص إلى فيديو في السوق، مما سمح للمستخدمين بإنشاء مقاطع رسوم متحركة قصيرة من المطالبات النصية.
بعد أسابيع فقط من إعلان جوجل عن استحواذها على التكنولوجيا – Lumiere – تابعت OpenAI مع Sora. من المؤكد أن نماذج الأجيال التي شاركها مطور الذكاء الاصطناعي مثيرة للإعجاب، حيث يمتد مقطع فيديو واحد إلى دقيقة كاملة من الرسوم المتحركة. مع تطور التكنولوجيا، هل يمكن أن يكون العالم على أعتاب ثورة أفلام الذكاء الاصطناعي؟
OpenAI تدخل في سباق تحويل النص إلى فيديو مع Sora
ظهرت أول منصات تحويل النص إلى فيديو مدعومة بالذكاء الاصطناعي في عام 2022. وباتباع منطق مماثل لأدوات إنشاء الصور مثل Midjourney، فإنها تستخدم ما يسمى بنماذج الانتشار التي تبدأ بشيء مثل الضوضاء الثابتة أو عديمة الشكل، وبعد العديد من التكرارات تضبط الفيديو حتى يشبه المطالبة.
تم تطوير بعض نماذج نشر الفيديو الأولى بواسطة Pika وStability AI وRunway، لكن كبار شركات التكنولوجيا الكبرى دخلوا هذا المجال مؤخرًا.
في الشهر الماضي، أطلقت شركة ByteDance المالكة لـ TikTok، MagicVideo V2 لأول مرة، وتفاخرت بأن محرك توليد الفيديو الجديد يمكنه إنشاء مخرجات أكثر دقة ووضوحًا من البدائل الحالية.
وبعد أسبوعين فقط، أعلنت Google عن Lumiere، حيث عرضت مخرجات منصة تحويل النص إلى فيديو والتي تشبه للوهلة الأولى لقطات فيلم حقيقية.
هل كان إعلان OpenAI يوم الخميس بمثابة رد فعل غير متوقع على منافسيها؟ ربما، لكن الشركة نجحت في إظهار سمة رئيسية في Sora يمكن أن تمنحها الأفضلية.
Sora تطلق لأول مرة إنشاء فيديو متعدد المشاهد
في حين حققت كل من جوجل وBytedance قفزة إلى الأمام في جودة ودقة مقاطع الفيديو التي يولدها الذكاء الاصطناعي، لم يخرج أي منهما عن القالب العام لمولدات تحويل النص إلى فيديو الحالية، والتي تنتج مقاطع قصيرة من منظور واحد غير متحرك عادة.
في المقابل، تشتمل مقاطع الفيديو الترويجية لـ Sora على زوايا الكاميرا المتحركة، وقطع سينمائية، ومشاهد متعددة – وكلها يتم إنشاؤها من خلال مطالبة واحدة.
التطوير أمر بالغ الأهمية. بعد كل شيء، بغض النظر عن مدى روعة الرسوم المتحركة، فإن مقاطع الفيديو التي يتم إنشاؤها بواسطة الحلول الحالية غالبًا ما تكون أكثر من مجرد صور GIF عالية الوضوح.
تمهيد الطريق لفيلم الذكاء الاصطناعي
من خلال تمكين المزيد من الاستمرارية عبر المقاطع الممتدة، يتوقع سورا مستقبلًا يكون فيه الذكاء الاصطناعي قادرًا على إنتاج أفلام كاملة، حيث يكون كل مشهد نتيجة لمحفز مختلف، لكن الشخصيات والأسلوب يظلان متسقين طوال الوقت.
في الوقت الحالي، لم تعلن OpenAI عن تاريخ إصدار المنصة. لم تذكر Google ولا Bytedance متى ستوفران خدماتهما.
ولكن بعد أقل من 7 أسابيع من عام 2024، أظهرت شركات التكنولوجيا الكبرى فيما بينها تقدمًا كبيرًا في المجال الذي يشير إلى الإمكانات التحويلية للتكنولوجيا في الأفلام والإعلانات وغيرها من صناعات وسائط الفيديو.




