الكشف عن نموذج (Genie 3) المبتكر لإنتاج بيئات تفاعلية ثلاثية الأبعاد في الزمن الحقيقي
خطوة مذهلة في مسار الوصول إلى الذكاء العام الاصطناعي

كشفت شركة (DeepMind) التابعة لجوجل عن نموذجها الجديد (Genie 3) الذي يُعد تطوراً مذهلاً في مجال الذكاء الاصطناعي العام (AGI)، إذ يتيح إنشاء بيئات ثلاثية الأبعاد تفاعلية في الوقت الحقيقي انطلاقاً من نص مكتوب أو صورة مما يفتح آفاقاً غير مسبوقة في تصميم المحاكاة والتجارب البصرية الرقمية.
ويصف فريق (DeepMind) هذا النموذج بأنه “نقطة تحول”، بفضل قدرته على تذكّر ما قام بإنشائه سابقاً، ما يمنحه اتساقاً في المحاكاة الفيزيائية دون الحاجة إلى محرك فيزياء مبرمج مسبقاً، وهذا الاتساق يمكّنه من فهم حركة وتفاعل الأشياء بطريقة تحاكي الإدراك البشري.
أبرز ميزات (Genie 3)
يقدم (Genie 3) مجموعة مبتكرة من الميزات التي تدفع حدود التفاعل في الزمن الحقيقي، وتمنحه تفوقاً واضحاً على النماذج السابقة، أبرزها:
تفاعل مباشر بزمن حقيقي
يتيح النموذج للمستخدمين التنقل ضمن العوالم الافتراضية بسرعة 24 إطاراً في الثانية وبدقة 720 بيكسل، مع الحفاظ على الاتساق البصري لعدة دقائق.
ذاكرة بصرية ممتدة
يحتفظ النموذج بتفاصيل المشهد حتى بعد مغادرته والعودة إليه، مما يعزز الواقعية والاستمرارية في التجربة التفاعلية.
تعديل المشاهد عبر أوامر نصية
يمكن تغيير الطقس، إضافة شخصيات، أو تعديل عناصر البيئة باستخدام أوامر نصية بسيطة، دون الحاجة لإعادة تشغيل المحاكاة.
أداة بحث وتدريب متقدمة
يُستخدم (Genie 3) لتدريب وكلاء ذكاء اصطناعي في بيئات محاكاة غنية ومتغيرة، ما يسرّع من تطور قدراتهم الإدراكية والتفاعلية في طريق الوصول إلى الذكاء الاصطناعي العام AGI.
ماهي التطبيقات العملية لنموذج (Genie 3)؟
وفقًا لمدونة DeepMind الرسمية، يقدم (Genie 3) إمكانات تطبيقية واسعة، تشمل:
نمذجة الظواهر الفيزيائية
يتيح للمستخدمين اختبار سلوك عناصر طبيعية مثل الماء، الإضاءة، والجاذبية، بطريقة واقعية وتفاعلية.
محاكاة النظم البيئية
يمكن إنشاء بيئات افتراضية حيّة تتضمن تفاعلات بين الحيوانات والنباتات، في أنظمة معقّدة تحاكي العالم الحقيقي.
توليد الرسوم المتحركة
يمنح النموذج المستخدمين القدرة على ابتكار شخصيات خيالية وسيناريوهات ديناميكية بأسلوب سهل وتفاعلي.
استكشاف الأماكن التاريخية
يتيح (Genie 3) تجربة استكشافية تتجاوز الزمان والمكان، من خلال إعادة بناء مواقع وأحداث من الماضي.
“الأحداث العالمية القابلة للتوجيه”
وهي ميزة مبتكرة تسمح بتعديل العالم الافتراضي وتخصيصه بسهولة، مثل تغيير الطقس أو إدخال عناصر جديدة عبر أوامر نصية.
كما تتيح للمستخدمين اختبار سيناريوهات افتراضية بديلة من نوع “ماذا لو”، وهي مفيدة في التعليم والتدريب، وتطوير النماذج الذكية القادرة على التعلّم من التجربة.
مقارنة Genie 3 مع الإصدارات السابقة
Genie 3 يتفوق على Genie 2 وأقرانه الآخرين في الشركة من حيث الواقعية، الاتساق الزمني، والقدرة على التفاعل اللحظي وعدد من المعايير الأخرى ما يجعله مناسباً لتطبيقات أكثر تطوراً مثل ألعاب الفيديو، التعليم التفاعلي، و الروبوتات المتقدمة.
ويوضح الجدول أدناه أبرز الفروقات:
المؤشر | GameNGen | Genie 2 | Veo | Genie 3 |
---|---|---|---|---|
الدقة (Resolution) | 320 بكسل | 360 بكسل | من 720 بكسل حتى 4K | 720 بكسل |
المجال (Domain) | مخصص للألعاب | بيئات ثلاثية الأبعاد | عام | عام |
التحكم (Control) | مخصص للألعاب | أفعال محدودة عبر لوحة المفاتيح/الماوس | وصف على مستوى الفيديو* | التنقل؛ أحداث عالمية قابلة للتعديل بالنص |
أفق التفاعل (Interaction Horizon) | بضع ثوانٍ | 10-20 ثانية | 8 ثوانٍ | عدة دقائق |
زمن استجابة التفاعل (Interaction Latency) | زمن حقيقي | غير لحظي | غير متاح | زمن حقيقي |
نحو ذكاء عام اصطناعي أكثر تطوراً
لا يقتصر Genie 3 على توليد عوالم واقعية، بل يمكنه أيضاً إنشاء بيئات خيالية بالكامل وتعديلها ديناميكياً استجابة للأوامر النصية، ورغم أن النموذج لا يزال في مرحلة المعاينة البحثية، ترى الشركة فيه أداة حاسمة لتدريب وكلاء الذكاء الاصطناعي العام.
ويُستخدم Genie 3 حالياً لتدريب وكيل الذكاء العام الخاص بالشركة (SIMA) الذي يتعلم من التجربة بطريقة مشابهة للتعلّم البشري وهو ما يعزز رؤية (DeepMind) بأن نماذج العوالم التفاعلية تمثل المفتاح للانتقال من الذكاء الاصطناعي الضيق إلى ذكاء عام متعدد القدرات.
المصادر