搜索资源列表
RL_Toolbox_Windows_Source_20b
- 这个是机器学习的一种算法的强化学习的工具箱. 请您用winzip解压缩-this is a machine learning algorithm toolbox of reinforcement learning. Please use winzip decompress
srcV0624
- 这个代码是policy iteration算法关于强化学习的. 请您用winzip 解压缩-policy iteration algorithm for enhanced learning. Please use winzip decompress
muti-agents-toolbox
- 多智能体工具包,可直接用来进行多智能体强化学习算法设计与仿真
kevin
- 基于强化学习的robocode代码,实现了一个通过RL进行动作选择的坦克,导入robocode的相关文件夹下即可执行。
catandmouse
- 用java写的一个强化学习程序,猫通过学习学会了抓老鼠。
RL_Toolbox_Windows_Source_20b
- 强化学习算法(R-Learning)难得的珍贵资料,在国外找的。分享给大家。
Q算法
- 强化学习算法 Q源码
diantimonixitong
- [问题描述] 设计一个电梯模拟系统。这是一个离散的模拟程序,因为电梯系统是乘客和电梯等 “活动体”构成的集合,虽然他们彼此交互作用,但他们的行为是基本独立的。在离散的模拟中,以模拟时钟决定每个活动体的动作发生的时刻和顺序.系统在某个模拟瞬间处理有待完成的各种事情,然后把模拟时钟推进到某个动作预定要发生的下一个时刻。 [基本要求] (1) 模拟某校五层教学楼的电梯系统。该楼有一个自动电梯,能在每层停留。五个楼层由下
reinforcement
- 贝叶斯学习与强化学习结合技术的研 详细介绍了强化学习的算法和理论-Bayesian learning and reinforcement learning combined with the technical details of the study of reinforcement learning algorithms and theory
ReinforcementLearning
- 利用MATLAB实现Q学习,简单易懂,欢迎大家下载(Using MATLAB to implement Q learning)
ReinforcementLearning
- 马尔卡夫决策过程理论定义了一个数学模型,可用于随机动态系统的最优决策过程。 强化学习利用这个数学模型将一个现实中的问题变成一个数学问题。 强化学习就是:追求最大回报G 追求最大回报G就是:找到最优的策略π?。 策略π?告诉在状态s,应该执行什么行动a。 最优策略可以由最优价值方法v?(s)或者q?(s,a)决定(The Markov decision process theory defines a mathematical
Q_learning
- q学习,强化学习中的人工智能方法,实用型强化学习(Q learning, reinforcement of artificial intelligence methods, practical reinforcement learning)
qianghuazhi7
- 强化学习是机器学习中的一类,通过本实例讲解怎样运用强化(Reinforcement learning is a kind of machine learning. It explains how to use strengthening through this example.)
qianghuazhi8
- 强化学习比较抽象,要想理解强化学习,必须通过实例才能理解(Intensive learning is more abstract. In order to understand intensive learning, it must be understood through an example.)
DeepMind-Atari-Deep-Q-Learner-master
- 基于python环境的简明深度强化学习深度Q学习实现代码(Concise deep intensive learning based on Python environment and deep Q learning implementation code)
Acotor-critic approach
- Actor-critic方法的python代码,供强化学习者使用和参考,希望对大家有帮助(Actor-critic approach)
q-learning
- 在动态环境中使用Q学习优化算法进行优化,仿真软件为Matlab(Q-learning optimization algorithm is used to optimize in dynamic environment. The simulation software is MATLAB)
重要-SARSA
- 强化学习的一种,基于sarsa算法,寻找最优路径,可运行(One kind of reinforcement learning, based on sarsa algorithm, seeks the optimal path, which can run)
FLAC3D学习高级进阶
- 提高FLAC,对于初学者可以更快的提高自己的FLAC3D水平,强化自己的技能(Improve FLAC, for beginners can quickly improve their FLAC3D level, strengthen their skills)
深度学习入门:基于python的理论与实践
- 本书是深度学习真正意义上的入门书,深入浅出地剖析了深度学习的原理和相关技术。书中使用Python3,尽量不依赖外部库或工具,从基本的数学知识出发,带领读者从零创建一个经典的深度学习网络,使读者在此过程中逐步理解深度学习。书中不仅介绍了深度学习和神经网络的概念、特征等基础知识,对误差反向传播法、卷积神经网络等也有深入讲解,此外还介绍了深度学习相关的实用技巧,自动驾驶、图像生成、强化学习等方面的应用,以及为什么加深层可以提高识别精度等“为什