政策强化学习

2022-05-08

以下示例是关于Whatever中包含政策强化学习用法的示例代码,想了解政策强化学习的具体用法?政策强化学习怎么用?政策强化学习使用的例子?那么可以参考以下相关源代码片段来学习它的具体使用方法。

[英]:policy reinforcement learning源码类型:Whatever
state----action----probability/'goodness' of taking the action
1         1                     0.6 
1         2                     0.4 
2         1                     0.3
2         2                     0.7

本文地址:https://www.itbaoku.cn/snippets/785603.html