DouZero_For_HappyDouDiZhu 是基于快手开源的斗地主强化学习框架,实现的欢乐斗地主 AI 助手。
- 本项目基于DouZero
- 环境配置请移步项目DouZero
- 模型默认为WP,更换模型请修改start.py中的模型路径
- 运行main.py即可
- SL (
baselines/sl/
): 基于人类数据进行深度学习的预训练模型
- DouZero-ADP (
baselines/douzero_ADP/
): 以平均分数差异(Average Difference Points, ADP)为目标训练的Douzero智能体
- DouZero-WP (
baselines/douzero_WP/
): 以胜率(Winning Percentage, WP)为目标训练的Douzero智能体

评论