سلام مجری محترم در کدنویسی در محیط پایتون برای یادگیری تقویتی تسلط داشته باشد.در مقاله ضمیمه که الگوریتمی پیشنهاد داده شده است که مشکل تعداد زیاد اکشن ها در محیط گسسته را حل می کند مجری باید الگوریتم پیشنهادی مقاله را برای محیطی کاستومی که موجود است پیاده سازی کند مقاله و کد الگوریتم و محیط موجود است و مجری باید این دو را با هم مچ کند.برای این پروژه یادگیری تقویتی یک محیط کاستوم دارم که تعداد اکشن ها خیلی زیاد است با dqn حل کردم که زمان حل خیلی بالاست در مقاله ضمیمه که کدش هم موجود است یک الگوریتم برای حل این مشکل گفته شده است که میخام این الگوریتم روی محیط من اجرا بشه.
این پروژه قبلا در توسط فناوران امید انجام شده است یا قابل انجام است، لطفا جهت تماس با فناوران امید با شماره های پایین صفحه سایت در واتساپ و تلگرام یا ایمیل در تماس باشید، لطفا برای انجام آن تماس نگیرید فقط در واتساپ یا تلگرام یا ایمیل به صورت متنی در ارتباط باشید تا امکان سنجی گردد.