Skip to content

RL 训练参数尝试

limiao edited this page Nov 24, 2017 · 18 revisions

几个方向

  • 是否固定 Image Model

limiao: 目前都是固定Image Model的

  • 尝试Adam训练

limiao: 准备尝试使用Adam训练

  • 尝试不同学习率

limiao: 目前正在尝试两种0.1和0.01两种学习率,decay factor还是0.6

  • 尝试加入Multi-Task loss
Clone this wiki locally