کرسی ترویجی «کاربرد یادگیری تقویتی توزیعی در مدلسازی عاملمحور برای بازار برق» با ارائه دکتر محمدرضا اصغری اسکوئی در دانشکده علوم ریاضی و رایانه دانشگاه علامه طباطبائی برگزار شد.
همچنین دکتر فرزاد اسکندری، استاد آمار دانشگاه علامه طباطبائی به عنوان داور داخلی و دکتر حمید کردبچه، استاد اقتصاد دانشگاه الزهرا به عنوان داور خارجی به نقد و بررسی این نظریه پرداختند.
گفتنی است امروزه یکی از روشهای پرکاربرد تحلیل بازار برق، مدلسازی عامل محور ABM است و الگوریتم Q-learning یکی از ابزارهای اصلی برای شبیهسازی رفتار عاملها در این روش است.
با توجه به اهمیت مسئله مدیریت ریسک در بازار برق، الگوریتم Q-learning باید به گونهای طراحی شود که علاوه بر افزایش سود، کاهش ریسک را نیز در قیمتدهی لحاظ کند. با توجه به انتزاعی بودن مفهوم مطلوبیت، تعریف تابعی مناسب برای مطلوبیت همواره یکی از چالشهای این روش بوده است.