sutton强化学习随书MATLAB代码

返回
开发语言:Others
实例大小:145.83K
发布日期:2023-11-19
浏览次数:309
实例介绍
【资源树视图】
    【实例简介】
    sutton强化学习随书MATLAB代码,内附使用说明,亲测可运行,对理解书中内容很有帮助。
    【实例截图】
    【核心代码】
    85e91855-e848-411e-bc8d-f0227806c73f
    └── suntton强化学习书籍所有代码
    ├── ~$内容说明.doc
    ├── Chapter 2 (Evaluative Feedback)
    │?? ├── binary_bandit_exps.m
    │?? ├── binary_bandit_exps_Script.m
    │?? ├── exercise_2_11.m
    │?? ├── exercise_2_11_Script.m
    │?? ├── exercise_2_5.m
    │?? ├── exercise_2_7.m
    │?? ├── exercise_2_7_Script.m
    │?? ├── n_armed_testbed.m
    │?? ├── n_armed_testbed_softmax.m
    │?? ├── opt_initial_values.m
    │?? ├── opt_initial_values_Script.m
    │?? ├── persuit_method.m
    │?? ├── persuit_method_Script.m
    │?? ├── reinforcement_comparison_methods.m
    │?? ├── reinforcement_comparison_methods_Script.m
    │?? └── sample_discrete.m
    ├── Chapter 3 (The Reinforcement Learning Problem)
    │?? ├── rr_action_bellman.m
    │?? └── rr_state_bellman.m
    ├── Chapter 4 (Dynamic Programming)
    │?? ├── cmpt_P_and_R.m
    │?? ├── ex_4_2_sys_solv.m
    │?? ├── ex_4_5_policy_evaluation.m
    │?? ├── ex_4_5_policy_improvement.m
    │?? ├── ex_4_5_rhs_state_value_bellman.m
    │?? ├── ex_4_5_Script.m
    │?? ├── gam_rhs_state_bellman.m
    │?? ├── gam_Script.m
    │?? ├── iter_poly_gw_inplace.m
    │?? ├── iter_poly_gw_not_inplace.m
    │?? ├── jcr_example.m
    │?? ├── jcr_policy_evaluation.m
    │?? ├── jcr_policy_improvement.m
    │?? └── jcr_rhs_state_value_bellman.m
    ├── Chapter 5 (Monte Carlo Methods)
    │?? ├── cmpt_bj_value_fn.m
    │?? ├── determineReward.m
    │?? ├── ex_5_4_Script.m
    │?? ├── gen_rt_episode.m
    │?? ├── handValue.m
    │?? ├── init_unif_policy.m
    │?? ├── mc_es_bj_Script.m
    │?? ├── mcEstQ.m
    │?? ├── mk_rt.m
    │?? ├── rt_pol_mod.m
    │?? ├── shufflecards.m
    │?? ├── soft_policy_bj_Script.m
    │?? ├── stateFromHand.m
    │?? └── velState2PosActions.m
    ├── Chapter 6 (Temporal Difference Learning)
    │?? ├── cmpt_arms_err.m
    │?? ├── eg_6_2_learn.m
    │?? ├── eg_rw_batch_learn.m
    │?? ├── learn_cw.m
    │?? ├── learn_cw_Script.m
    │?? ├── mk_arms_error_plt.m
    │?? ├── mk_batch_arms_error_plt.m
    │?? ├── mk_fig_6_6.m
    │?? ├── plot_cw_policy.m
    │?? ├── plot_gw_policy.m
    │?? ├── R_learn_acq.m
    │?? ├── R_learn_acq_Script.m
    │?? ├── run_all_gw_Script.m
    │?? ├── wgw_w_kings.m
    │?? ├── wgw_w_kings_n_wind.m
    │?? ├── wgw_w_kings_n_wind_Script.m
    │?? ├── wgw_w_kings_Script.m
    │?? ├── wgw_w_stoch_wind.m
    │?? ├── wgw_w_stoch_wind_Script.m
    │?? ├── windy_gw.m
    │?? └── windy_gw_Script.m
    ├── Chapter 7 (Eligibility Traces)
    │?? ├── eg_7_5_episode.m
    │?? ├── eg_7_5_learn_at.m
    │?? ├── eg_7_5_learn_rt.m
    │?? ├── eg_7_5_Script.m
    │?? ├── gw_w_et.m
    │?? ├── gw_w_et_Script.m
    │?? ├── rw_accumulating_vs_replacing_Script.m
    │?? ├── rw_episode.m
    │?? ├── rw_offline_ntd_learn.m
    │?? ├── rw_offline_ntd_learn_Script.m
    │?? ├── rw_offline_tdl_learn.m
    │?? ├── rw_offline_tdl_learn_Script.m
    │?? ├── rw_online_ntd_learn.m
    │?? ├── rw_online_ntd_learn_Script.m
    │?? ├── rw_online_tdl_learn.m
    │?? ├── rw_online_tdl_learn_Script.m
    │?? ├── rw_online_w_et.m
    │?? ├── rw_online_w_et_Script.m
    │?? └── rw_online_w_replacing_traces.m
    ├── Chapter 8 (Generailzation and Function Approximation)
    │?? ├── do_mnt_car_Exps.m
    │?? ├── get_ctg.m
    │?? ├── GetTiles_Mex.C
    │?? ├── GetTiles_Mex_Script.m
    │?? ├── linAppFn.m
    │?? ├── mnt_car_learn.m
    │?? ├── next_state.m
    │?? ├── ret_q_in_st.m
    │?? ├── stp_fn_approx_Script.m
    │?? ├── targetF.m
    │?? ├── tiles.C
    │?? └── tiles.h
    ├── Chapter 9 (Planning and Learning)
    │?? ├── blocking_mz_Script.m.m
    │?? ├── do_ex_9_1_exps.m.m
    │?? ├── dynaQ_maze.m.m
    │?? ├── dynaQ_maze_Script.m.m
    │?? ├── dynaQplus_maze.m.m
    │?? ├── dynaQplus_maze_Script.m.m
    │?? ├── ex_9_4_dynaQplus.m.m
    │?? ├── ex_9_4_dynaQplus_Script.m.m
    │?? ├── mk_ex_9_1_mz.m.m
    │?? ├── mk_ex_9_2_mz.m.m
    │?? ├── mk_ex_9_3_mz.m.m
    │?? └── plot_mz_policy.m.m
    ├── suntton非matlab代码说明.doc
    └── 内容说明.doc

    9 directories, 113 files

    本文地址:https://www.itbaoku.cn/example/5b96269da7124cfead3f7d5273ee35cd.html

    查看更多
    实例下载

    sutton强化学习随书MATLAB代码

    转到下载页面

    相关编程实例