جوجل تربط بين خرائط العالم والعوالم الافتراضية
أعلنت شركة ديب مايند (DeepMind) التابعة لجوجل عن خطوة جديدة في مجال النماذج التوليدية، بعد ربط نموذج العالم التوليدي الخاص بها المعروف باسم Genie 3 ببيانات خدمة التجوّل الافتراضي Street View داخل خرائط جوجل. الخطوة تتيح إنشاء عوالم افتراضية تفاعلية تنطلق من مواقع حقيقية على الخريطة، يتم تحويلها بصريًا وسلوكيًا إلى بيئات رقمية قابلة للاستكشاف.
كيف تعمل التقنية الجديدة؟
تعتمد التجربة الجديدة على واجهة تسمى Maps Imagery Grounding، وهي أداة تستخدم بيانات الصور الملتقطة في خدمة Street View لتكون بمثابة “أرضية” واقعية تُبنى فوقها العوالم التوليدية.
ووفق ما استعرضته ديب مايند في النماذج التجريبية، يختار المستخدم نقطة على الخريطة داخل منطقة مشمولة في Street View، ثم يحدد طابعًا بصريًا اختياريًا للمشهد، مثل:
- عالم المحيطات
- الرمال الصحراوية
- العصر الحجري
- الأفلام بالأبيض والأسود
بعد ذلك يمكن إدخال وصف للشخصية أو الكيان الذي يتحرك داخل المشهد، ليقوم نموذج Genie 3 ببناء عالم افتراضي تفاعلي يبدأ من لقطات حقيقية لمكان فعلي في Street View، ثم يطوّره إلى بيئة رقمية يمكن التنقل داخلها.
قاعدة بيانات الخرائط كسلاح تفوق استراتيجي
تستفيد جوجل من مخزونها الضخم من بيانات الخرائط والصور الميدانية، التي جمعتها على مدى سنوات من خلال سيارات Street View وكاميرات محمولة وأجهزة تصوير داخلية في المباني والمتاجر والجامعات والطرق السريعة وحتى بعض المناطق النائية.
هذه المكتبة لا تُستخدم فقط في خدمات الملاحة والبحث عن الأماكن، بل أصبحت مادة تدريبية مرجعية لأنظمة الذكاء الاصطناعي، خصوصًا النماذج التي تحتاج فهمًا ثلاثي الأبعاد للعالم الحقيقي، مثل أنظمة القيادة الذاتية والروبوتات التي تتحرك في بيئات معقدة.
هذا النوع من البيانات يمنح جوجل وديب مايند أفضلية واضحة مقارنة بشركات منافسة لا تمتلك تغطية عالمية بالقدر نفسه. فبدل الاعتماد فقط على بيئات افتراضية مصطنعة بالكامل، يمكن تدريب الأنظمة الجديدة داخل عوالم تحاكي مدنًا وطرقًا وأزقة حقيقية، مع تنويعات بصرية وسيناريوهات لا نهائية ينتجها النموذج التوليدي.
Genie ليس لعبة للمستخدمين… بل ساحة تدريب للآلات
على الرغم من أن الفكرة تبدو قريبة من ألعاب الفيديو والعوالم المفتوحة، توضح ديب مايند أن Genie لا يُنظر إليه أساسًا كمنتج استهلاكي ترفيهي، بل كأداة بحثية وبيئة تدريب للذكاء الاصطناعي والروبوتات.
الفكرة الجوهرية هي توفير عالم افتراضي غني، يمكن فيه لوكلاء الذكاء الاصطناعي:
- التنقل بين الشوارع والممرات والأبواب والعوائق
- الاستدلال على المواقع والعلاقات المكانية بين الأشياء
- التعلّم من التجربة والخطأ داخل بيئة أقرب ما تكون إلى الواقع
وبدل إرسال روبوت حقيقي إلى مدينة مزدحمة لاختبار خوارزمية تنقل جديدة، يمكن تدريب الوكيل الرقمي أولًا في نسخة افتراضية من المدينة نفسها مبنية على بيانات Street View، ولكن مع تحكم كامل في الظروف والتحديات.
أمثلة على الاستخدام: من الروبوتات إلى السيارات الذاتية القيادة
وكيل الذكاء الاصطناعي SIMA 2
يُستخدم النموذج بالفعل داخل ديب مايند لتدريب وكيل ذكاء اصطناعي يُعرف باسم SIMA 2. يشبه هذا الوكيل “مساعدًا رقميًا” يمكنه فهم التعليمات والتنقل في بيئات ثلاثية الأبعاد، وهو يحتاج إلى عوالم متنوعة ليطوّر قدراته على اتخاذ القرار والتخطيط والتكيّف مع مواقف جديدة.
البيئات القائمة على Genie 3 تمنح SIMA 2 مساحة آمنة للتجربة، مع سيناريوهات واقعية مستمدة من مدن وشوارع فعلية، لكنها تخضع بالكامل لسيطرة الباحثين وتعديلهم.
Waymo والقيادة الذاتية في عوالم توليدية
من جهة أخرى، تعتمد شركة Waymo المملوكة لألفابت – الشركة الأم لجوجل – على هذه التقنية لمحاكاة سيناريوهات قيادة مختلفة للسيارات ذاتية القيادة. فبدل الاكتفاء بمسارات اختبار ثابتة أو بيانات قيادة مُسجّلة مسبقًا، يمكن إنشاء مواقف جديدة مستندة إلى شوارع حقيقية، مع تغييرات في الإضاءة والطقس والكثافة المرورية أو حتى تصميم المشهد نفسه.
هذا النهج يساعد في اختبار استجابات أنظمة القيادة الذاتية لحالات نادرة أو خطرة يصعب تجريبها في العالم الحقيقي، مثل مفاجآت الطريق أو سلوكيات غير متوقعة من السائقين الآخرين أو المشاة.
نطاق جغرافي محدود حاليًا وخطط للتوسّع
توضح ديب مايند أن دعم المواقع الحقيقية في التجربة الحالية يقتصر على الولايات المتحدة، مع خطط لتوسيع النطاق إلى مناطق أخرى لاحقًا. وتشير الشركة إلى أن المشروع ما يزال في مرحلة نموذج بحثي تجريبي، وليس منتجًا نهائيًا موجهًا إلى السوق.
هذا يعني أن واجهة Maps Imagery Grounding ونموذج Genie 3 يخضعان لتحديثات مستمرة، مع العمل على إصدار أكثر تقدمًا من الناحية البصرية والتفاعلية، وربما أكثر كفاءة في استهلاك الموارد الحاسوبية، خاصة أن إنشاء عوالم توليدية ثلاثية الأبعاد يتطلب قدرات معالجة كبيرة.
السياق العالمي: سباق العوالم الاصطناعية
التحرّك الحالي من جوجل وديب مايند يأتي ضمن اتجاه عالمي أوسع نحو بناء ما يمكن وصفه بـ”نماذج العالم” (World Models)، وهي أنظمة ذكاء اصطناعي تحاول فهم بنية العالم المادي وتمثيله رقميًا، وليس فقط معالجة النصوص أو الصور بشكل منفصل.
عدة شركات ومختبرات بحثية تعمل على مشاريع مشابهة، بعضها يرتبط بألعاب الفيديو المفتوحة المصدر، وبعضها يبني بيئات محاكاة خاصة. لكن قلة من هذه الجهات تمتلك قاعدة بيانات واقعية على مستوى كوكبي مثل تلك التي تديرها جوجل عبر خرائطها.
في هذا السياق، يشير باحثون في معاهد مرموقة مثل MIT وStanford في دراسات منشورة عبر مكتباتهم البحثية إلى أن البيئات الغنية متعددة الحواس (رؤية، صوت، حركة) تُعد عنصرًا حاسمًا لتطوير أنظمة ذكاء اصطناعي قادرة على الفهم العميق للعالم وليس فقط التعرف على الأنماط السطحية.
فرص وتحديات للمنطقة العربية
بالنسبة للمنطقة العربية، يطرح هذا التطور سؤالًا حول مدى جاهزية البنية الرقمية المحلية للاستفادة من عوالم توليدية مبنية على بيانات جغرافية حقيقية. كثير من المدن العربية باتت مغطاة بشكل جيد في خرائط جوجل وStreet View، خصوصًا في دول الخليج وبعض العواصم الكبرى، لكن مستوى التفاصيل والتحديث يختلف من دولة إلى أخرى.
في حال توسّع دعم Genie 3 خارج الولايات المتحدة، قد تظهر فرص لتطوير تطبيقات عربية في مجالات مثل:
- تدريب روبوتات خدمية تعمل في المولات والمطارات والمستشفيات
- محاكاة أنظمة نقل ذكية وحركة المرور في المدن الكبرى
- تجارب تعليمية تفاعلية لزيارة مواقع تاريخية أو أثرية بشكل توليدي
لكن هذه الفرص ترتبط بعوامل أخرى، من بينها سياسات خصوصية البيانات، وإمكانية الوصول إلى واجهات برمجية متقدمة مثل Maps Imagery Grounding، ومدى استعداد الجامعات ومراكز الأبحاث في المنطقة للاستثمار في هذا النوع من المشاريع.
أسئلة مفتوحة حول الخصوصية والاستخدام المسؤول
إلى جانب الفوائد التقنية، تثار تساؤلات حول كيفية استخدام بيانات Street View في بناء عوالم توليدية. جوجل تعتمد منذ سنوات على سياسات إخفاء الوجوه ولوحات السيارات في الصور، وتتيح للمستخدمين طلب طمس مبانٍ أو مواقع محددة، لكن تحويل هذه الصور إلى بيئات تفاعلية قد يفتح نقاشًا جديدًا حول حدود الاستخدام المقبول.
من جهة أخرى، الاعتماد المتزايد على المحاكاة في تدريب الأنظمة الحساسة – مثل السيارات الذاتية القيادة – يفرض مسؤولية إضافية على الشركات لضمان أن البيئات التوليدية تعكس تعقيد الواقع بدقة كافية، وألا تخلق أوهام أمان زائفة عند الانتقال من العالم الافتراضي إلى الشوارع الحقيقية.
تحوّل في دور الخرائط: من أداة إرشاد إلى مسرح افتراضي
التجربة التي تكشف عنها ديب مايند تشير إلى تحوّل أعمق في الطريقة التي تُفهم بها الخرائط الرقمية. فبدل كونها مجرد طبقة معلوماتية ثنائية الأبعاد تُستخدم للوصول من نقطة إلى أخرى، تتحول خرائط جوجل تدريجيًا إلى بنية تحتية لعوالم افتراضية، يمكن فوقها بناء طبقات من التخييل البصري والسلوكي.
هذا التحول قد ينعكس مستقبلًا على مجموعة واسعة من الصناعات، من الألعاب والتعليم والترفيه، إلى الروبوتات والقيادة الذاتية وأنظمة التخطيط الحضري. ومع تطوير نسخة أكثر تقدمًا من Genie، يصبح السؤال المطروح ليس فقط كيف سنستخدم الخرائط للوصول إلى الأماكن، بل كيف ستستخدم الآلات هذه الخرائط لتتعلم العيش والعمل في العالم من حولنا.