资源列表
[通讯/手机编程] ReinforcementLearning
说明:马尔卡夫决策过程理论定义了一个数学模型,可用于随机动态系统的最优决策过程。 强化学习利用这个数学模型将一个现实中的问题变成一个数学问题。 强化学习就是:追求最大回报G 追求最大回报G就是:找到最优的策略π?。 策略π?告诉在状态s,应该执行什么行动a。 最优策略可以由最优价值方法v?(s)或者q?(s,a)决定(The Markov decision process theory defines a mathematical model that can be used for the<下雪 > 在 2025-11-25 上传 | 大小:1kb | 下载:0
[VHDL编程] kintex board manuals
说明:International Journal of Innovative Research in Science, Engineering and Technology<hkuma > 在 2025-11-25 上传 | 大小:5.42mb | 下载:0
[VHDL编程] ahb_master
说明:AHB总线接口描述,MASTER的接口描述,AMB总线协议(AHB bus interface descr iption, MASTER interface descr iption, AMB bus protocol)<小萌子 > 在 2025-11-25 上传 | 大小:4kb | 下载:0
[其他小程序] measure
说明:mUDP是UDP的延伸,除了具有UDP的功能外,还能记录所发送的包的信息。mUdpSink可以把接收到的包的信息记录到文件中。(MUDP is an extension of UDP, in addition to having the function of UDP, it can also record the information of the packets sent. MUdpSink can record the information of the received packet<nibo12 > 在 2025-11-25 上传 | 大小:17kb | 下载:0