AlphaZero登上Science封面-听铁哥浅析阿尔法元(5)
2018-12-11 11:17:栏目:原创
能够控制运动的深度强化学习,迟早会改变工业界,它不仅是无人车里的核心技术, 更是对话,推荐系统, 金融交易, 甚至是图像识别的利器,几乎各类需要监督学习的事情,说到底强化学习都有实力。 你如果制造一个聊天机器人, 你当然希望它能够揣测你的意图和你谈情说爱而不是背书。 你要一个推荐系统, 你当然不需要它天天给你推你刚看过的小黄片,而是带着你探索一段BBC-性的秘密。 所以, 强化学习, 是人工智能的大势所趋啊。
更有甚者,我们可以设立一个具有类似地球的物理环境的地方,让配备了深度强化学习系统的虚拟生物进行各种活动,看它们能否利用这个环境发现和利用其中的物理定律。
铁哥本人的研究目前涉及深度强化学习与RNN的结合, 因此参与课程也是与铁哥结盟, 共同进军未来的深度强化学习世界的机会。