强化学习RL

时间：2021-04-15 19:26:44

相关推荐

强化学习RL

强化学习（Reinforcement Learning RL）也有很多其他名字，例如再励学习、增强学习、评价学习，是机器学习的范式和方法论之一，用于描述和解决智能体在与环境的交互过程中，通过学习策略以达成回报最大化或实现特定目标的问题。

强化学习过程主要由4部分构成：智能体（agent）、观测到的状态（observation/state）、奖励（reward）和行为（action）

深度学习如图像识别和语音识别解决的是感知的问题，强化学习解决的是决策的问题。人工智能的终极目的是通过感知进行智能决策。所以，将近年发展起来的深度学习技术与强化学习算法结合而产生的深度强化学习算法是人类实现人工智能终极目的的一个很有前景的方法。

深度强化学习是强化学习与深度学习结合的结果。顾名思义，就是将传统强化学习中的某一部分用深度学习来完成。

传统强化学习中的行为以及价值都是需要人为定义的，这也就是为什么传统强化学习起源较早，但是应用并不广泛的原因之一。而深度学习恰好将这一问题解决了，强化学习中的行为以及价值都用一个深度学习的网络来学习得到，这样不需要人为设定，使得强化学习可以广泛应用于很多领域。而传统强化学习无法解决的连续性动作的问题，深度强化学习也可以解决，使用对应的Actor-critic网络即可。

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。