ホリケン's diary

趣味はでぃーぷらーにんぐ

Rainbow DQNのまとめ

~Raibow DQNとは~ Deep Q Networkをベースとした以下の6つの改善手法全てを統合したモデル (1) Double DQN DQNの課題 Q-learningでは教師データをmaxQ-valueで更新していた。この方法だと本来は価値の高くないはずの行動を最適だと判断してQ-valueの更新を行…