资源列表
[通讯/手机编程] ReinforcementLearning
说明:马尔卡夫决策过程理论定义了一个数学模型,可用于随机动态系统的最优决策过程。 强化学习利用这个数学模型将一个现实中的问题变成一个数学问题。 强化学习就是:追求最大回报G 追求最大回报G就是:找到最优的策略π?。 策略π?告诉在状态s,应该执行什么行动a。 最优策略可以由最优价值方法v?(s)或者q?(s,a)决定(The Markov decision process theory defines a mathematical<下雪 > 在 2025-06-01 上传 | 大小:1kb | 下载:0
[matlab例程] ant colony algorithms
说明:关于旅行商问题的蚁群算法实现,matlab源代码(Solving the TSP question with ant colony algorithms.)<LEES_k > 在 2025-06-01 上传 | 大小:1kb | 下载:0
[通讯/手机编程] PMSMdq
说明:本人自己做得仿真,matlab电机模型,simulink,仿真包括模型和s函数(My own simulation, matlab motor model, simulink, simulation includes model and s function)<songlingling > 在 2025-06-01 上传 | 大小:1kb | 下载:0