ذكاء اصطناعي لا يكتفي برؤية الصور
الأجيال الحالية من نماذج الذكاء الاصطناعي تُبهر في التعرف على الأشياء داخل الصور: سيارة، شجرة، مبنى، طريق. لكنها كثيرًا ما تتوقف عند هذا الحد. ما لا تفعله جيدًا هو فهم القواعد غير المرئية التي تنظم العالم: من أين يمكن العبور؟ أين يُمنَع المرور؟ وكيف يرتبط شارع بآخر ضمن شبكة معقدة من المسارات والحدود؟
فريق باحثين في جوجل يحاول قلب المعادلة. الفكرة لم تعد الاكتفاء بالإجابة عن سؤال: “ماذا يوجد في الصورة؟”، بل الانتقال إلى سؤال أعمق: “كيف يمكنني التحرك داخل هذا المشهد؟”. لتحقيق ذلك، طوّر الفريق نظامًا يصنع خرائط ومسارات اصطناعية، ويستخدمها لتدريب نماذج متعددة الوسائط على فهم الفضاء والتنقل ضمنه بطريقة أقرب إلى القدرات البشرية.
من التعرف على الأشياء إلى فهم القواعد
العديد من الدراسات الأكاديمية، منها أبحاث منشورة على arXiv، تشير إلى أن النماذج البصرية بارعة في تمييز الكائنات، لكنها أقل كفاءة في استيعاب العلاقات: أي الطرق متصلة؟ ما الحدود التي لا يمكن تجاوزها؟ وأين تتغير قواعد الحركة من حي لآخر؟ هذه بالضبط الفجوة التي تستهدفها جوجل.
الدراسة الجديدة تنطلق من فرضية واضحة: إذا أمكن توليد عدد هائل من الخرائط الاصطناعية، مع مسارات صحيحة وموسومة بوضوح، يمكن عندها تدريب النموذج ليس فقط على رؤية الطرق والمباني، بل على “استنتاج” ما هو مسموح وما هو ممنوع من حركات داخل هذه الخرائط، كما يفعل البشر حين ينظرون إلى خريطة مدينة لأول مرة.
خط إنتاج آلي للخرائط والمسارات
بدل الاعتماد على بيانات مدن حقيقية تخضع لاعتبارات الخصوصية والملكية، اختارت جوجل مسارًا مختلفًا: إنشاء خرائط اصطناعية بالكامل عبر خط إنتاج آلي. يقوم هذا الخط بعدة خطوات مترابطة:
- توليد بيئات مكانية اصطناعية: أشكال طرق، شوارع، تقاطعات، مبانٍ، وحدائق، مع تنويع كبير في البنية والتخطيط.
- تحديد قواعد الحركة: وضع قيود واضحة لكل خريطة: اتجاهات السير، الشوارع ذات الاتجاه الواحد، المناطق المغلقة أمام السيارات أو المشاة.
- استخراج مسارات صحيحة: تحديد الطرق القانونية للوصول من نقطة بداية إلى نقطة هدف، مع استبعاد المسارات التي تكسر القواعد.
- تحويل الخرائط إلى صور وبيانات نصية: بحيث تُقدَّم للنموذج كمدخل بصري (صورة خريطة) مصحوبًا بأوصاف أو أسئلة نصية حول التنقل.
بهذا الأسلوب، يحصل النظام على ملايين الأمثلة من “خرائط + قواعد + مسارات”، يمكن استخدامها لتعليم النماذج كيفية فهم الفضاء بدل مجرد وصفه.
ما الذي تتعلمه النماذج فعليًا؟
جوهر التجربة لا يقتصر على إيجاد أقصر طريق، بل على فهم منطق الحركة داخل البيئة. النموذج يُطلب منه مثلاً إيجاد مسار من النقطة (أ) إلى النقطة (ب) دون مخالفة القواعد، أو تحديد ما إذا كان مسار معين قانونيًا أم لا، بناءً على ما يراه في الخريطة.
هذا يعني أن النموذج يتعلم:
- تمييز الطرق القابلة للاستخدام من غيرها.
- استيعاب فكرة الحدود: جدار، سياج، مبنى، أو حتى نهر يمنع العبور.
- التعامل مع قيود معقدة مثل الاتجاه الواحد أو منع المرور في ساعات معينة (في البيئات الأكثر تعقيدًا).
- تعميم هذه الفهم على خرائط لم يسبق له رؤيتها من قبل.
هذا المستوى من الفهم يقرب النماذج خطوة من طريقة تفكير البشر حين ينظرون إلى خريطة: لا يحتاج الشخص إلى تجربة كل طريق ليعرف أنه غير مسموح؛ يكفي أن يرى إشارة أو شكلًا دالًا على ذلك.
لماذا يهم هذا التوجه عالميًا؟
الانعكاسات المحتملة تمتد بعيدًا عن التطبيقات التقليدية مثل الملاحة في المدن. أنظمة القيادة الذاتية، والروبوتات التي تتحرك في المستودعات، والطائرات بدون طيار، وحتى الروبوتات المنزلية، كلها تحتاج إلى نماذج تفهم الفضاء وقواعد الحركة داخله، لا أن تحفظ لقطات ثابتة لعالم لا يتوقف عن التغير.
منصات تقنية مثل TechCrunch وThe Verge تُبرز باستمرار أن التحدي الأكبر أمام الانتقال إلى أنظمة مستقلة فعلاً ليس قوة الحوسبة فحسب، بل القدرة على فهم المشهد واتخاذ قرارات مناسبة في بيئات جديدة. تدريب النماذج على قراءة الخرائط وقواعد التنقل جزء أساسي من هذا الطريق.
العالم العربي: فرص وتحديات في الخرائط الذكية
في المنطقة العربية، يتقاطع هذا التوجه مع مجموعة من التحديات الواقعية. كثير من المدن العربية تشهد توسعًا عمرانيًا سريعًا، وتغيّرًا مستمرًا في الطرق والبنية التحتية، مع تفاوت واضح في جودة البيانات المكانية وتحديثها من بلد لآخر.
إذا استطاعت تقنيات مثل التي تطورها جوجل أن تنتقل من الخرائط الاصطناعية إلى تعزيز فهم الخرائط الحقيقية، فهذا قد ينعكس على:
- تحسين تطبيقات الملاحة المحلية: فهم أفضل لتحويلات السير، الشوارع المغلقة، والمناطق ذات الحركة الكثيفة، حتى في مدن لا تُحدث خرائطها باستمرار.
- خدمات الطوارئ: توجيه أسرع وأكثر دقة لسيارات الإسعاف والإطفاء في أحياء معقدة أو عشوائية التخطيط.
- الخدمات اللوجستية والتوصيل: تحسين مسارات التوصيل في مدن كبيرة مثل القاهرة، الرياض، الدار البيضاء، أو بغداد، حيث التحديات الميدانية حقيقية.
لكن هذه الفرص تصطدم بعدة عوامل؛ منها محدودية توفر بيانات خرائط محدثة عالية الدقة، واعتبارات تتعلق بالخصوصية، وحساسية بيانات البنية التحتية في بعض الدول.
رأي خبراء: ما الخطوة التالية؟
باحثون في مختبرات جامعية دولية، مثل معهد MIT وستانفورد، يناقشون منذ سنوات فكرة “الفهم البنيوي” للصور، أي قدرة النماذج على إدراك العلاقات المكانية والقواعد الضمنية داخل المشاهد. ما تقوم به جوجل يمكن اعتباره تطبيقًا عمليًا واسع النطاق لهذه الفكرة من خلال الخرائط.
بعض الخبراء يرون أن الخطوة التالية ستكون دمج هذا الفهم المكاني مع بيانات من الواقع الفعلي: صور الأقمار الصناعية، وبيانات الشوارع الحية، ومعلومات من مستخدمين على الأرض. عندها لن يكون النموذج قادرًا على قراءة خريطة وحسب، بل على التكيّف مع تغيرها في الزمن الحقيقي، مثل إغلاق طريق بسبب أعمال صيانة أو تغيير اتجاه السير في حي كامل.
كيف يمكن للمنطقة العربية الاستفادة مبكرًا؟
حتى قبل نضج هذه التقنيات بالكامل، يمكن لمؤسسات عربية رسمية وخاصة التحرك في عدة اتجاهات:
- الاستثمار في البيانات المكانية المفتوحة: مبادرات لنشر خرائط محدثة، ومسارات، وقواعد سير عبر بوابات بيانات حكومية مفتوحة.
- الشراكات مع الشركات التقنية: إتاحة بيئات تجريبية في مدن مختارة لاختبار نماذج جديدة للتنقل الذكي والروبوتات الحضرية.
- دعم البحث المحلي: تشجيع فرق بحثية في الجامعات العربية للعمل على نماذج متعددة الوسائط تفهم الخرائط والنصوص والصور معًا، بدل الاعتماد الكامل على حلول مستوردة.
هذا النوع من الاستثمار لا يقتصر على تحسين الملاحة فحسب، بل يفتح الباب أمام خدمات جديدة في مجالات السياحة، وإدارة المرور، والتخطيط الحضري، وحتى الألعاب والواقع المعزز داخل المدن العربية.
ما وراء الخرائط: نحو نماذج تفهم العالم
المحاولة التي تقودها جوجل لتعليم الذكاء الاصطناعي قراءة الخرائط ليست مشروعًا جانبيًا؛ هي جزء من تحول أوسع نحو نماذج لا تكتفي بوصف العالم، بل تحاول فهم بنيته وقواعده. العالم الواقعي ليس صورة ثابتة، بل شبكة من علاقات وحدود ومسارات ممكنة ومستحيلة.
إذا نجحت هذه المقاربة، قد نرى خلال سنوات نماذج قادرة على استيعاب فضاءات معقدة: من مدن مزدحمة في المنطقة العربية إلى مبانٍ ذكية ومصانع مؤتمتة. والاختبار الحقيقي سيكون دائمًا في مدى قدرة هذه النماذج على اتخاذ قرارات آمنة وعادلة وشفافة، في عالم لا يكف عن تغيير قواعده.