【资源树视图】
【实例简介】
sutton强化学习随书MATLAB代码,内附使用说明,亲测可运行,对理解书中内容很有帮助。
【实例截图】
【核心代码】
85e91855-e848-411e-bc8d-f0227806c73f
└── suntton强化学习书籍所有代码
├── ~$内容说明.doc
├── Chapter 2 (Evaluative Feedback)
│?? ├── binary_bandit_exps.m
│?? ├── binary_bandit_exps_Script.m
│?? ├── exercise_2_11.m
│?? ├── exercise_2_11_Script.m
│?? ├── exercise_2_5.m
│?? ├── exercise_2_7.m
│?? ├── exercise_2_7_Script.m
│?? ├── n_armed_testbed.m
│?? ├── n_armed_testbed_softmax.m
│?? ├── opt_initial_values.m
│?? ├── opt_initial_values_Script.m
│?? ├── persuit_method.m
│?? ├── persuit_method_Script.m
│?? ├── reinforcement_comparison_methods.m
│?? ├── reinforcement_comparison_methods_Script.m
│?? └── sample_discrete.m
├── Chapter 3 (The Reinforcement Learning Problem)
│?? ├── rr_action_bellman.m
│?? └── rr_state_bellman.m
├── Chapter 4 (Dynamic Programming)
│?? ├── cmpt_P_and_R.m
│?? ├── ex_4_2_sys_solv.m
│?? ├── ex_4_5_policy_evaluation.m
│?? ├── ex_4_5_policy_improvement.m
│?? ├── ex_4_5_rhs_state_value_bellman.m
│?? ├── ex_4_5_Script.m
│?? ├── gam_rhs_state_bellman.m
│?? ├── gam_Script.m
│?? ├── iter_poly_gw_inplace.m
│?? ├── iter_poly_gw_not_inplace.m
│?? ├── jcr_example.m
│?? ├── jcr_policy_evaluation.m
│?? ├── jcr_policy_improvement.m
│?? └── jcr_rhs_state_value_bellman.m
├── Chapter 5 (Monte Carlo Methods)
│?? ├── cmpt_bj_value_fn.m
│?? ├── determineReward.m
│?? ├── ex_5_4_Script.m
│?? ├── gen_rt_episode.m
│?? ├── handValue.m
│?? ├── init_unif_policy.m
│?? ├── mc_es_bj_Script.m
│?? ├── mcEstQ.m
│?? ├── mk_rt.m
│?? ├── rt_pol_mod.m
│?? ├── shufflecards.m
│?? ├── soft_policy_bj_Script.m
│?? ├── stateFromHand.m
│?? └── velState2PosActions.m
├── Chapter 6 (Temporal Difference Learning)
│?? ├── cmpt_arms_err.m
│?? ├── eg_6_2_learn.m
│?? ├── eg_rw_batch_learn.m
│?? ├── learn_cw.m
│?? ├── learn_cw_Script.m
│?? ├── mk_arms_error_plt.m
│?? ├── mk_batch_arms_error_plt.m
│?? ├── mk_fig_6_6.m
│?? ├── plot_cw_policy.m
│?? ├── plot_gw_policy.m
│?? ├── R_learn_acq.m
│?? ├── R_learn_acq_Script.m
│?? ├── run_all_gw_Script.m
│?? ├── wgw_w_kings.m
│?? ├── wgw_w_kings_n_wind.m
│?? ├── wgw_w_kings_n_wind_Script.m
│?? ├── wgw_w_kings_Script.m
│?? ├── wgw_w_stoch_wind.m
│?? ├── wgw_w_stoch_wind_Script.m
│?? ├── windy_gw.m
│?? └── windy_gw_Script.m
├── Chapter 7 (Eligibility Traces)
│?? ├── eg_7_5_episode.m
│?? ├── eg_7_5_learn_at.m
│?? ├── eg_7_5_learn_rt.m
│?? ├── eg_7_5_Script.m
│?? ├── gw_w_et.m
│?? ├── gw_w_et_Script.m
│?? ├── rw_accumulating_vs_replacing_Script.m
│?? ├── rw_episode.m
│?? ├── rw_offline_ntd_learn.m
│?? ├── rw_offline_ntd_learn_Script.m
│?? ├── rw_offline_tdl_learn.m
│?? ├── rw_offline_tdl_learn_Script.m
│?? ├── rw_online_ntd_learn.m
│?? ├── rw_online_ntd_learn_Script.m
│?? ├── rw_online_tdl_learn.m
│?? ├── rw_online_tdl_learn_Script.m
│?? ├── rw_online_w_et.m
│?? ├── rw_online_w_et_Script.m
│?? └── rw_online_w_replacing_traces.m
├── Chapter 8 (Generailzation and Function Approximation)
│?? ├── do_mnt_car_Exps.m
│?? ├── get_ctg.m
│?? ├── GetTiles_Mex.C
│?? ├── GetTiles_Mex_Script.m
│?? ├── linAppFn.m
│?? ├── mnt_car_learn.m
│?? ├── next_state.m
│?? ├── ret_q_in_st.m
│?? ├── stp_fn_approx_Script.m
│?? ├── targetF.m
│?? ├── tiles.C
│?? └── tiles.h
├── Chapter 9 (Planning and Learning)
│?? ├── blocking_mz_Script.m.m
│?? ├── do_ex_9_1_exps.m.m
│?? ├── dynaQ_maze.m.m
│?? ├── dynaQ_maze_Script.m.m
│?? ├── dynaQplus_maze.m.m
│?? ├── dynaQplus_maze_Script.m.m
│?? ├── ex_9_4_dynaQplus.m.m
│?? ├── ex_9_4_dynaQplus_Script.m.m
│?? ├── mk_ex_9_1_mz.m.m
│?? ├── mk_ex_9_2_mz.m.m
│?? ├── mk_ex_9_3_mz.m.m
│?? └── plot_mz_policy.m.m
├── suntton非matlab代码说明.doc
└── 内容说明.doc
9 directories, 113 files
本文地址:https://www.itbaoku.cn/example/5b96269da7124cfead3f7d5273ee35cd.html
查看更多