
لم يعد الذكاء الاصطناعي مقتصرًا على تلقي الأوامر النصية أو إنشاء الصور الثابتة. في مؤتمر Google I/O 2026، كشفت جوجل عن Gemini Omni، وهو نموذج جديد يصفه الفريق بأنه قادر على «إنشاء أي شيء من أي مدخل» – بدءًا بالفيديو. الخطوة الأولى في هذا المسار هي نموذج Gemini Omni Flash الذي بدأ طرحه اليوم، ويعد بتغيير طريقة تفاعلنا مع المحتوى المرئي.
من «فيديو حسب الوصف» إلى «حرّر فيديو كأنك تتحدث»
حتى وقت قريب، كانت أدوات مثل Veo 3.1 تسمح بتوليد فيديوهات بناءً على نصوص أو صور فقط. لكن Gemini Omni يذهب أبعد: يمكنه استقبال خليط من الصور والصوت والفيديو والنص معًا، ثم إنتاج فيديو عالي الجودة يستند إلى معرفة جوجل بالعالم الحقيقي. الأهم أن التحرير يتم عبر محادثة طبيعية – كل تعليق جديد يبني على ما قبله، بحيث تبقى الشخصيات والعناصر متسقة.
تخيل أنك صورت مشهدًا في الحديقة، ثم قلت للنموذج «غيّر لون السماء إلى الغروب وأضف طائرًا يحلق». هذا ما تَعِد به جوجل: «فيديو يصبح نقطة بداية لشيء لم تكن لتتمكن من تصويره بنفسك». يمكنك تحرير الحركة وإضافة شخصيات جديدة أو تغيير الزاوية أو الإضاءة أو حتى أسلوب المشهد بالكامل.
فهم الفيزياء والخلفية المعرفية
من أبرز التحسينات في Omni قدرته على فهم القوى الفيزيائية الأساسية مثل الجاذبية، الطاقة الحركية، وديناميكيات السوائل. هذا يعني أن الفيديو المولّد لن يبدو وكأنه «رسوم متحركة غريبة»، بل سيحاكي سلوك الأشياء في الواقع. بالإضافة إلى ذلك، يدمج النموذج معرفة جوجل التاريخية والعلمية والثقافية، مما يسمح بإنتاج فيديوهات تفسيرية قصيرة تشرح مفاهيم معقدة ببصرية واضحة.
تحذير مهم: الصوت الرقمي والخصوصية
في البداية، سيدعم Omni فقط الإشارات الصوتية كمرجع لتوليد الصوت. لكن الميزة الأكثر إثارة (وإثارة للقلق) هي إمكانية إنشاء صورة رمزية (Avatar) رقمية تبدو وتتكلم مثلك تمامًا، باستخدام صوتك. جوجل تؤكد أن لديها «سياسات واضحة لحماية المستخدمين من الضرر»، وتختبر حاليًا ميزة تحرير الصوت والكلام قبل إطلاقها بشكل مسؤول. كما ستُضاف علامة مائية رقمية غير مرئية SynthID إلى كل فيديو مولّد، لتأكيد مصدره.
متى وكيف ستحصل عليه؟
Gemini Omni Flash متاح اليوم لجميع مشتركي Google AI Plus و Pro و Ultra حول العالم. كما سيبدأ هذا الأسبوع بالوصول إلى مستخدمي YouTube Shorts وتطبيق YouTube Create. لكن السؤال الحقيقي الذي تنتظر الإجابة عليه هو: هل ستتجاوز جودة الفيديو المولّد مشكلة «وادي الخوف» (Uncanny Valley) التي عانى منها Veo 3.1 وغيره من المولدات؟ التجارب الميدانية فقط ستكشف إن كانت قدرات Omni ترقى إلى الوعود الكبيرة.
خلاصة عملية
إذا كنت من صانعي المحتوى أو المصممين، فهذه الأداة قد تغير سير عملك: تصور فكرة بسرعة ثم حرّرها بالمحادثة. لكن لا تتوقع كمالًا فوريًا – القيود المتعلقة بتحرير الصوت والجودة البصرية ما زالت قيد الاختبار. جرّبها اليوم عبر تطبيق Gemini أو YouTube Shorts، وراقب التحديثات القادمة. الأهم، تذكر أن كل فيديو سيحمل بصمة SynthID، مما يجعله قابلاً للتتبع، وهو خطوة إيجابية نحو الاستخدام المسؤول للذكاء الاصطناعي التوليدي.
روابط مذكورة في المصدر
المصدر: Engadget