لو تخيّل النظام سيناريو معيّناً لتطوّر الأحداث، هل كان ليغيّر أفعاله تماماً مثل البشر؟ فالبشر يستخدمون الخيال لتقييم الأوضاع، والخيال قد يكون سيناريوات صغيرة وبسيطة، وهو ما انطلقت منه شركة DeepMind، التابعة لـ»غوغل»، من مثال بسيط جداً: لو وضعنا كأساً على حافة الطاولة، من المحتمل أن نتوقف لحظة للنظر في مدى استقراره وما إذا كان قد يقع وينكسر، وبناءً عليه نغيّر موقع الكأس. تصوّر سيناريو وقوع الكأس هو خيال، لذلك لماذا لا يقوم الذكاء الاصطناعي بعملية التخيل هذه؟
يعتبر الخيال قدرة إنسانية معقدة نستخدمها يومياً، لكن من دونه لن يستطيع الذكاء الاصطناعي التخطيط للمستقبل والتعامل مع ما يمكن أن يطرأ من تغييرات غير مبرمجة للتعامل معها، وبالتالي لا بد للذكاء الاصطناعي من أن يتخيّل… ليتطوّر.
عام 2015، طورت غوغل نظام الذكاء الاصطناعي AlphaGo المتخصص في لعبة Go وهي لعبة بين شخصين تعتمد على محاصرة أحجار المنافس وتحتاج إلى التخطيط. نجح AlphaGo في التغلب على بطل هذه اللعبة. تقول الشركة على مدونتها «لقد شهدنا بعض النتائج الهائلة في هذا المجال، وخاصة في برامج مثل AlphaGo التي تستخدم «نموذجاً داخلياً» لتحليل كيف تؤدي الإجراءات إلى نتائج مستقبلية من أجل التحليل والتخطيط. هذه النماذج الداخلية تعمل بشكل جيد لأن بيئة اللعبة مثالية من حيث القواعد الواضحة المعالم التي تسمح بالتنبؤ بالنتائج بدقة كبيرة في كل الظروف تقريبا». من هنا، نشأ تحدٍ آخر فالعالم الحقيقي ليس لعبة، «العالم الحقيقي معقد، والقواعد ليست واضحة جداً والمشاكل التي لا يمكن التنبؤ بها تظهر دائماً. حتى بالنسبة إلى الأنظمة الأكثر ذكاء، التخيل في هذه البيئات المعقدة عملية طويلة ومكلفة».
لذلك بدأ الباحثون في مختبرات DeepMind في تطوير ذكاء اصطناعي يتمتع بخاصية الخيال، بحيث يمكن للنظام تحليل القرارات ووضع خطط مستقبلية من خلال تخيّل نتائج أفعاله والعواقب قبل القيام بها وتغييرها في حال كانت سيئة.

بإمكان النظام تحليل القرارات ووضع خطط مستقبلية من خلال تخيّل نتائج أفعاله


في ورقتين بحثيتين جديدتين، يشرح علماء DeepMind مجموعة من المقاربات التي تعتمد على نهج التخطيط القائم على الخيال ويقدمون البنى التي تؤمن طرقاً جديدة للأنظمة الذكية للتعلم وبناء الخطط لتحقيق أقصى قدر من الكفاءة في مهمتها.
تقدم الورقة الأولى أداة لتعزيز الخيال وهي بنية جديدة لتعزيز التعليم العميق تجمع بين نموذجين، هما: النموذج القائم، model-based، أي عندما يستخدم النظام نموذجاً مبرمجاً مسبقاً للقيام بمهمته، والنموذج الحر model-free، أي عندما يعتمد النظام على بعض المحاولات والأخطاء والتجارب السابقة لتحديد تصرفاته. الجمع بين النموذجين أوجد نظاماً يجمع بين التجارب والأخطاء ومعالجة البيانات المحيطة والقدرة على المحاكاة بحيث يمكن لهذا النظام معرفة المزيد عن البيئة التي يوجد فيها والتفكير قبل القيام بأي تصرف. تضيف الورقة أنه على النقيض من معظم أساليب التعلم والتخطيط التي تعتمد على النماذج القائمة والتي تصف كيفية استخدام النموذج للوصول إلى خطة، فإن أداة تعزيز الخيال تتعلم كيفية تفسير التنبؤات من نموذج بيئة محددة لوضع خطط ضمنية بطرق اعتباطية، وذلك باستخدام التنبؤات كسياق إضافي في شبكات التخطيط العميق.
تكمل الورقة البحثية الثانية بما سمته «المخطِط القائم على الخيال»، وهو أول نظام مرتكز على النموذج القائم يتخذ سلسلة قرارات متتابعة يمكن أن يتعلم بناء الخطط وتقييمها وتنفيذها. قبل اتخاذ أي إجراء، بإمكان النظام أن يؤدي عدداً من خطوات التخيل، والتي تنطوي على اقتراح عمل أو فعل متخيل وتقييمه من خلال التموذج القائم للتخيل. يتم تجميع جميع الإجراءات والنتائج المتخيلة، بشكل متكرر، في «سياق خطة» تأخذ بالحسبان الأفعال المستقبلية الحقيقية والمتخيلة. كذلك بإمكانه أن يقرر حتى كيف يتخيل مثل اختبار الإجراءات المتخيلة البديلة، وربط تسلسل الإجراءات، أو بناء «شجرة خيال» أكثر تعقيداً من خلال التنقل بمرونة بين الأوضاع المتخيلة.
اختبرت الشركة نظامها في لعبة فيديو قديمة تدعى sokoban، حيث على اللاعبين دفع أقفاص لحل اللغز. بعض الحركات التي يقوم بها اللاعب قد تجعل المرحلة غير قابلة للحل، وبالتالي يجب أن يخطط مسبقاً. لم يعط الباحثون نظام قواعد اللعبة، إلا أنه تمكن من حل 85% من المراحل.
لا يزال إدخال الخيال إلى الذكاء الاصطناعي في بداياته، إلا أنه يعدّ خطوة أساسية في تطوير الأنظمة الذكية للتعامل مع المواقف المفاجئة. لكن من يضمن حدود خيال هذه الأنظمة في السنوات البعيدة القادمة؟