Edit | Delete
最初の探索で最適行動を決定し、それを続けるgreedy法、greedy法から確率εでランダムに行動を選び、探索を発生させるε-greedy法、最適行動を取ることを基本方針に、より試行回数が少ない行動を優先的に選択するUCB法
AI 第1期 AI基礎 Python基礎 E資格
Optimized studying based on the forgetting curve vastly improves memorization. - What is reminDO? Memorize
koki3614
Flag post / Block