PDA

View Full Version : سوال: سوال در مورد صورت مسئله bandit



زهرا313
شنبه 27 اردیبهشت 1393, 21:16 عصر
سلام
من برای برنامه بندیت تا قسمت Greedy یک برنامه نوشتم ولی فکر می کنم صورت مسئله رو درست متوجه نشدم. می خواستم خواهش کنم ببینید الگوریتمی رو که در نظر گرفتم درست هست یا نه
من 5 ماشین در نظر گرفتم که در هر task هزار بار دسته هر کدوم از ماشین ها رو می کشیم. 5000 task داریم. بعد از هر هزار بار چک می کنیم که میانگین reward کدوم task ماکزیمم هست.
مثلا ماشین شماره 2 ماکزیمم میانگین reward رو داره. حالا ماشین 2 رو انتخاب کردیم و 1000 بار دسته اون رو می کشیم و این کار رو ادامه می دیم.

الگوریتم قسمت epsilon-greedy رو کلا نمی دونم.