当前位置: 首页>>代码示例>>Python>>正文


Python Model.mc_control方法代码示例

本文整理汇总了Python中Model.Model.mc_control方法的典型用法代码示例。如果您正苦于以下问题:Python Model.mc_control方法的具体用法?Python Model.mc_control怎么用?Python Model.mc_control使用的例子?那么恭喜您, 这里精选的方法代码示例或许可以为您提供帮助。您也可以进一步了解该方法所在Model.Model的用法示例。


在下文中一共展示了Model.mc_control方法的2个代码示例,这些例子默认根据受欢迎程度排序。您可以为喜欢或者感觉有用的代码点赞,您的评价将有助于系统推荐出更棒的Python代码示例。

示例1: Model

# 需要导入模块: from Model import Model [as 别名]
# 或者: from Model.Model import mc_control [as 别名]
from Model import Model

model = Model(100)
model.mc_control(1000000)
model.dump_states("1000000i_result.json")
model.surface_plot()
开发者ID:darrenyaoyao,项目名称:ReinforcementLearning,代码行数:8,代码来源:Monte_Carlo_Control.py

示例2: range

# 需要导入模块: from Model import Model [as 别名]
# 或者: from Model.Model import mc_control [as 别名]
from Model import Model
import numpy as np
import json

mse = np.zeros(11)
for l in range(11):
	model_mc = Model(100)
	model_mc.mc_control(1000000)
	model_sarsa = Model(100)
	model_sarsa.backward_sarsa_control(100000, l/10.0)
	#mse_hit = np.arange(210, dtype = np.float32).reshape(10, 21)
	#mse_stick = np.arange(210, dtype = np.float32).reshape(10, 21)
	#mse = {"hit": mse_hit, "stick": mse_stick}
	for i in range(10):
		for j in range(21):
			for action in model_mc.states[i][j].action_value_function:
				mse[l] += ((model_sarsa.states[i][j].action_value_function[action] - 
								model_mc.states[i][j].action_value_function[action]) ** 2)
with open("mean_square_error", 'w') as outfile:
	for i in range(11):
		outfile.write("lambda=" + str(i/10.0) + ": ")
		json.dump(mse[i], outfile)
		outfile.write("\n")

				
开发者ID:darrenyaoyao,项目名称:ReinforcementLearning,代码行数:25,代码来源:Sarsa_mse.py


注:本文中的Model.Model.mc_control方法示例由纯净天空整理自Github/MSDocs等开源代码及文档管理平台,相关代码片段筛选自各路编程大神贡献的开源项目,源码版权归原作者所有,传播和使用请参考对应项目的License;未经允许,请勿转载。