可选项:(在'Map.py'中修改)
- 三子棋,九宫格棋盘。
- 五子棋,10x10棋盘。
作业内容:实现基于强化学习的棋类博弈策略训练。
- 编写‘CnnNet.py’中 [作业内容] 部分的强化学习主干代码,训练出具备简单对弈能力的智能体。
- 撰写与代码对应的实验报告,包括但不限于问题定义、方法描述、数值实验设置、实验结果以及对结果的讨论。
- 尽量不要修改'Map.py'和‘CnnNet.py’中与强化学习无关的其他代码。
提交的文件包括:(第11周课上提交)
- 代码文件压缩包(.zip),必须包含训练后生成在‘.../Saver’中的对弈策略数据文件,压缩包命名:‘学号-姓名.zip’。
- 实验报告(.pdf),文件命名:‘学号-姓名.pdf’。
评价指标:
- 根据提交的代码和对弈策略数据,考察训练后的智能体对弈能力。
- 五子棋得分高于三子棋。
- 复杂度越低得分越高。
- 实验报告的学术性、规范性。
- 若发现作业内容部分代码与互联网上的原始例程高度相似,则判定为抄袭。
- 若发现作业内容部分代码以及实验报告与他人高度相似,则判定相关学生为抄袭。
- 若发现作业内容部分代码训练结果与提交的对弈策略数据不符,则判定为造假。
代码直接可以运行五子棋,如需运行三子棋,则需要将Map.py中的连子个数更改。