王晓林 发表于 2023-3-1 12:22:22

如何用python实现可列折扣马尔科夫决策过程实例的构造

最近在学习马尔科夫决策过程,想要找一些离散折扣马尔科夫决策过程,状态集可列,行动集有限,报酬函数有界的实例,尝试过搜论文或者直接搜,找到的好像都不是很理想。请问大家有没有什么好的方法?
或者如果要自己想要写算法构造这样的实例的话应该如何去构造呢?
还有想要学习这方面的python编程的话,各位有没有比较推荐的教材?
看了蛮多篇文章,但是自己开始写就有一种无从下手的感觉TAT
谢谢大家Orz






页: [1]
查看完整版本: 如何用python实现可列折扣马尔科夫决策过程实例的构造