ثورة جديدة في الذكاء الاصطناعي بلا بيانات بشرية
تحرّك لافت في سباق الذكاء الاصطناعي يقوده أحد أبرز العقول في المجال: ديفيد سيلفر، الباحث المعروف من DeepMind والعقل المدبر وراء نظام AlphaGo الشهير. وفقًا لتقرير موقع TechCrunch، نجح سيلفر في جمع نحو 1.1 مليار دولار لتمويل شركة جديدة تستهدف بناء أنظمة ذكاء اصطناعي قادرة على التعلم من الصفر، عبر التجربة الذاتية، بدلًا من الاعتماد على كميات هائلة من البيانات البشرية الجاهزة.
هذا التوجّه يضع على الطاولة سؤالًا جوهريًا: هل يمكن تدريب نماذج قوية دون «ابتلاع» الإنترنت وما يحويه من نصوص وصور وفيديوهات؟ وما الذي يعنيه ذلك لصناعة الذكاء الاصطناعي، وللمستخدمين، ولصنّاع المحتوى حول العالم، بما في ذلك العالم العربي؟
من AlphaGo إلى مشروع جديد: من هو ديفيد سيلفر؟
برَز اسم ديفيد سيلفر عالميًا بعد أن قاد في DeepMind فريق تطوير AlphaGo، النظام الذي هزم بطل العالم في لعبة «غو» عام 2016، كما غطّته BBC. لاحقًا شارك سيلفر في تطوير AlphaGo Zero وAlphaZero، وهي أنظمة لم تتعلّم من مباريات بشرية مسجّلة، بل من اللعب ضد نفسها ملايين المرات، لتصل إلى أداء يتفوّق على أفضل اللاعبين والبرامج التقليدية.
هذه التجربة رسّخت لدى سيلفر قناعة بأن التعلّم عبر التفاعل الذاتي مع البيئة قد يكون أكثر قوة على المدى البعيد من الاعتماد الكلي على البيانات البشرية. المشروع الجديد يبدو كامتداد منطقي لهذه الرؤية، لكن على نطاق أوسع بكثير من مجرد الألعاب.
ما الفكرة الأساسية للمشروع الجديد؟
بحسب TechCrunch، يستلهم المشروع نهجًا أقرب إلى طريقة تعلّم البشر: الطفل لا يقرأ الإنترنت ليتعلم المشي أو الكلام، بل يجرّب ويخطئ ويصحّح، متفاعلًا مع بيئته. الفكرة هنا هي بناء أنظمة قادرة على:
- التعلّم من التجربة والمحاولة والخطأ (Reinforcement Learning)
- توليد «بيئات» أو مهام افتراضية للتدرّب عليها ذاتيًا
- تحسين أدائها باستمرار دون الاعتماد على مجموعات ضخمة من البيانات المعلّمة من البشر
هذه المقاربة تختلف عن النماذج اللغوية الضخمة التقليدية التي درّبتها شركات مثل OpenAI وMeta وGoogle على مليارات الجمل والصور المأخوذة من الإنترنت، في عملية تسبّبت في نقاشات قانونية وأخلاقية واسعة حول حقوق الملكية الفكرية، كما ناقشتها تقارير من Reuters وThe New York Times.
لماذا 1.1 مليار دولار لمشروع لا يعتمد على بيانات بشرية؟
حجم التمويل يكشف حجم الرهان. المستثمرون الكبار باتوا يدركون أن نموذج «المزيد من البيانات والمزيد من الحوسبة» يواجه حدودًا حقيقية، أبرزها:
- قيود قانونية وحقوقية: نزاعات قضائية مع ناشرين وفنانين وشركات إعلامية بشأن استخدام المحتوى في تدريب النماذج بدون إذن صريح.
- تحيزات البيانات: المحتوى البشري يحمل تحيزات ثقافية وجندرية وعرقية، تنعكس مباشرة في سلوك النماذج، كما أظهرت دراسات منشورة في Nature Machine Intelligence.
- تشبّع مصادر البيانات: الإنترنت العام لم يعد «بِكرًا»؛ شركات عدة استخدمت بالفعل الكم الأكبر من المحتوى المتاح بجودة كافية للتدريب.
الذكاء الاصطناعي القادر على ابتكار مهامه الخاصة والتدرّب عليها ذاتيًا قد يوفّر طريقًا للخروج من هذا المأزق. بدل أن تبحث الشركات عن مزيد من النصوص والصور، يمكن للأنظمة أن تصنع «خبراتها» بنفسها داخل بيئات محاكاة أو عبر تفاعل منظم مع العالم الحقيقي.
مكاسب محتملة: من تقليل التحيز إلى تجنّب أزمة الملكية الفكرية
إذا نجح هذا النهج، فقد يغيّر قواعد اللعبة في عدة مستويات:
1. تقليل الاعتماد على المحتوى البشري
الانتقال من التدريب على بيانات بشرية إلى التعلم من التفاعل قد يقلّل من الحاجة إلى جمع بيانات حسّاسة أو محمية بحقوق النشر. هذا قد يخفف الضغط على الناشرين وصناع المحتوى، ويقلل من النزاعات القانونية التي تشهدها الفترة الحالية بين شركات الذكاء الاصطناعي ووسائل الإعلام، كما تناولتها Reuters.
2. تحكّم أفضل في التحيّزات
عندما يتعلم النظام من بيئة مصممة بعناية، يصبح من الممكن ضبط القواعد والمعايير التي تحكم خبراته، بدل أن يرث بلا وعي التحيزات الموجودة في نصوص الإنترنت. لا يعني هذا غياب التحيّز تمامًا، لكنه يفتح الباب أمام تصميم أكثر وعيًا للبيئات التدريبية.
3. قدرات أعمق على حل المشكلات
أظهرت أنظمة مثل AlphaZero أن التعلّم عبر اللعب الذاتي قاد إلى استراتيجيات لم تخطر حتى للاعبي النخبة، كما وثّق بحث DeepMind المنشور عبر Nature. تعميم هذا النهج على مجالات أخرى – من تصميم الخوارزميات إلى الاكتشاف العلمي – قد ينتج عنه حلول مبتكرة لا تأتي عادةً من تقليد السلوك البشري فقط.
تحديات واقعية أمام مشروع سيلفر
على الرغم من الحماس الكبير، الطريق أمام مشروع ديفيد سيلفر ليس سهلًا. هناك تحديات تقنية وعملية واضحة:
- تعقيد العالم الحقيقي: الألعاب بيئات مضبوطة، بينما الواقع أكثر فوضوية وتعقيدًا. نقل نجاحات AlphaGo إلى مجالات مفتوحة مثل اللغة أو الروبوتات يتطلب قفزات كبيرة في التصميم والتجريب.
- تكلفة الحوسبة: التعلّم عبر المحاكاة الذاتية يحتاج إلى موارد حوسبة هائلة؛ وهذا ما أثار نقاشًا متزايدًا حول البصمة البيئية للذكاء الاصطناعي، كما ناقشته تقارير International Energy Agency.
- السلامة والتحكم: أنظمة قادرة على تطوير استراتيجياتها ذاتيًا تحتاج إلى أطر سلامة ورقابة محكمة، حتى لا تظهر سلوكيات غير متوقعة أو غير مرغوبة، وهي قضية تناقشها أوراق بحثية عديدة في مجال AI Safety.
ما الذي يعنيه هذا للمستخدم العربي؟
على المدى القصير، قد لا يشعر المستخدم العادي بفرق مباشر؛ ما زالت النماذج اللغوية الضخمة وتطبيقاتها هي الواجهة الأساسية لتفاعل الناس مع الذكاء الاصطناعي. لكن على المدى المتوسط، قد نرى:
- أنظمة قادرة على التكيّف مع المستخدم وسياقه المحلي دون حاجة لتغذية مستمرة ببيانات شخصية حساسة
- تطبيقات في التعليم تتكيّف مع طريقة تعلّم الطالب، أقرب إلى «معلّم افتراضي» يجرّب أساليب مختلفة حتى يجد الأنسب
- روبوتات وخدمات ذكية تعمل في بيئات عربية محلية وتتعلم من التجربة الميدانية، لا من بيانات مستوردة بالكامل
توسّع هذا التوجه سيعتمد على مدى قدرة الجامعات والمختبرات العربية على الدخول في هذا المسار البحثي مبكرًا، بدل الاكتفاء بدور المستهلك للتقنيات المستوردة.
نقطة تحوّل أم رهان مبالغ فيه؟
تمويل بقيمة 1.1 مليار دولار لمشروع يراهن على التعلم من الصفر يعكس قناعة متزايدة داخل الصناعة بأن الجيل المقبل من الذكاء الاصطناعي لن يكتفي بتقليد البشر، بل سيحاول بناء «خبرته» الخاصة. إن نجح هذا النهج، فقد يخفف الاعتماد على البيانات البشرية، ويقلّل أزمات الملكية الفكرية والتحيز، ويفتح الباب أمام أنظمة أكثر استقلالية في التعلّم.
وإن تعثّر، فسيبقى درسًا مهمًا في حدود ما يمكن أن يقدمه التعلّم الذاتي وحده. في الحالتين، العالم يدخل مرحلة يعاد فيها طرح سؤال أساسي: كيف ينبغي أن يتعلم الذكاء الاصطناعي؟ والإجابة لن تكون تقنية فقط، بل ستتداخل فيها أسئلة قانونية وأخلاقية وثقافية، سيكون للعالم العربي مصلحة مباشرة في المشاركة في صياغتها لا مجرد التكيّف معها.