سلامبرای یک پروژه یادگیری تقویتی من یک محیط کاستوم دارم که تعداد اکشن ها خیلی زیاد هست. خودم با dqn حل کردم که زمان حل خیلی بالاست. یک مقاله ای پیدا کردم که یک الگوریتم برای حل این مشکل گفته که کدش هم هست. من میخوام این الگوریتم روی محیط من اجرا بشهاین خود مقالهhttps://arxiv.org/abs/1512.07679و کد الگوریتم مقاله هم در زیر میباشد:https://github.com/nikhil3456/Deep-Reinforcement-Learning-in-Large-Discrete-Action-Spacesپایتونبا استفاده از gym و tensorflowزودترین تایمی که میتونید بدید کی هست؟+++
این پروژه قبلا در توسط فناوران امید انجام شده است یا قابل انجام است، لطفا جهت تماس با فناوران امید با شماره های پایین صفحه سایت در واتساپ و تلگرام یا ایمیل در تماس باشید، لطفا برای انجام آن تماس نگیرید فقط در واتساپ یا تلگرام یا ایمیل به صورت متنی در ارتباط باشید تا امکان سنجی گردد.