“Gemini Omni: ما الذي يقدمه لصناع المحتوى في العالم العربي؟”

موقع بصراوي | دولي | فريق التحرير

أعلنت شركة جوجل عن إطلاق نموذجها الجديد Gemini Omni في المنطقة العربية، مما يتيح للمستخدمين إمكانية تحويل أفكارهم إلى محتوى مرئي بشكل مبتكر.
يأتي هذا الإطلاق كخطوة تكميلية للنجاح الذي حققه نموذج Nano Banana في العام الماضي في مجال معالجة الصور، حيث يمثل Gemini Omni تطورًا ملحوظًا كونه نموذجًا متعدد الوسائط، قادرًا على فهم النصوص والصور والأصوات والفيديوهات في آن واحد.
تحرير الفيديوهات بسهولة
يسمح النموذج بإنتاج وتعديل الفيديوهات من خلال استخدام اللغة الطبيعية عبر Gemini Omni Flash، الذي يعد أول عضو في هذه السلسلة ومتوافر حاليًا في تطبيقات Gemini وGoogle Flow وYouTube Shorts. تتميز هذه التقنية بالخصائص التالية:
فهم السياق: يتمتع النموذج بقدرة على تذكر الطلبات السابقة، مما يضمن تنسيق حركة الشخصيات والمشاهد بشكل متناسق.
تغيير الواقع: يمكن للمستخدمين ببساطة تعديل المشهد بالكامل أو تغيير تفاصيل محددة، مثل تحويل فيديو حقيقي إلى مشهد خيالي.
إضافة عناصر جديدة: يتيح النموذج إمكانية إدخال شخصيات أو أحداث غير متوقعة في الفيديوهات، مع تحسين الزوايا والأساليب بشكل متكامل.
ذكاء يفهم قوانين الفيزياء
لا يقتصر Gemini Omni على إنتاج صور جذابة، بل يتمتع بفهم عميق لكيفية عمل العالم الحقيقي، حيث يطبق قوانين الفيزياء مثل الجاذبية والطاقة الحركية لضمان واقعية حركة الأجسام في الفيديو.
يساعد هذا الفهم المستخدمين على تقديم أفكار معقدة بشكل بصري جذاب، حيث يربط النموذج بين اللغة والمعنى والصورة لتقديم سرد قصصي متميز.
مراجع متنوعة وأفاتار شخصي
يتيح نموذج “أومني” استخدام مراجع متعددة لإنشاء الفيديوهات، سواء كانت نصوصًا أو صورًا أو مقاطع صوتية.
تختبر جوجل حاليًا ميزة إنشاء فيديوهات باستخدام “أفاتار ذكاء اصطناعي” خاص بالمستخدم، وهو نسخة رقمية تعكس الشكل والصوت، مع التركيز على توفير هذه الميزة بمسؤولية.
الأمان والشفافية مع تقنية SynthID
لضمان الشفافية، توفر جوجل علامة مائية رقمية غير مرئية تُدعى SynthID لجميع الفيديوهات التي ينتجها النموذج.
تتيح هذه التقنية لأي شخص التحقق من أن الفيديو تم إنشاؤه بواسطة الذكاء الاصطناعي عبر أدوات “بحث جوجل” أو متصفح Chrome، مما يعزز الثقة في المحتوى الرقمي.



