为什么当谈到人工智能时 人们的注意力都集中在深度学习上

时间:2020-06-06 09:41:59来源:
导读还有其他一些看起来很有希望的AI领域,例如强化学习。请记住,像Google的DeepMind和OpenAI这样的尖端公司已经在这种方法上取得了突破。那么

还有其他一些看起来很有希望的AI领域,例如强化学习。请记住,像Google的DeepMind和OpenAI这样的尖端公司已经在这种方法上取得了突破。

那么什么是强化学习?好吧,很有趣,这不是新事物。“强化学习是一种经典的行为现象,自1950年代初以来在心理学文献中就广为人知,”马特·约翰逊(Matt Johnson)博士说。他是霍特国际商学院的心理学教授,也是《盲视》(Blindsight:The(Mostly)Hidden Ways Marketing)的作者。重塑我们的大脑。“最简单的形式是,行为的频率将根据行为的直接后果而上升或下降。动物行为和人类行为都是如此。”

但是,强化学习的一些关键原理已应用于AI模型。这通常被称为深度强化学习(因为它是通过深度学习来利用的)。Fiddler数据科学负责人Ankur Taly说:“强化学习需要一种行动,奖励和奖励。”“诸如机器人或角色之类的代理人与其周围的环境相互作用并观察到特定的活动,相应地做出响应以产生有益或理想的结果。”强化学习遵循特定的方法,并确定获得最佳结果的最佳方法。这与我们玩视频游戏的结构非常相似,在这种结构中,代理人进行了一系列尝试以获得最高分或最高奖励。经过多次迭代,它学会了最大化其累积奖励。”

实际上,用于强化学习的一些最有趣的用例涉及复杂的游戏。考虑DeepMind的AlphaGo的情况。该系统通过强化学习快速了解了Go的玩法,并在2016年击败了世界冠军Lee Sedol(该游戏的潜在动作比宇宙中原子数还多!)

但是,除了游戏以外,当然还有该技术的其他应用。为此,强化学习对于机器人技术尤其有用。例如,OpenAI已将此技术用于能够解决Rubik立方体的机械臂。

如Saleale.com的AI经济学家所看到的那样,强化学习甚至在寻找更好的税收政策和平等解决方案时被证明是有效的。Salesforce的首席科学家Richard Socher说:“我们认为强化学习框架非常适合揭示关于通过拉动不同的政策“杠杆”如何影响经济主体的行为的见解。“这是我们认为将来可以利用强化学习的众多方案之一。”

以下是强化学习可以产生影响的其他一些领域:

娱乐:“未来将由下一代“电影爱好者”和游戏玩家所寻求的自由形式的环境组成,”RCT工作室的首席运营官陈宇衡(YuhengChen)说。“由AI驱动的角色将共同适应以产生详尽的故事情节,并且消费者将不再局限于固定对话和非玩家角色之间的僵化互动。”

医疗保健:“想像一下如何尝试通过强化学习来教AI医生如何治疗医疗患者,”本特利大学数学科学助理教授Noah Giansiracusa说。“ AI医生可能几乎随机地尝试药物,以查看它们的作用,随着时间的流逝,应该学习模式并了解哪种药物在哪种情况下效果最好。但是我们显然不能让AI医生对实际患者进行这些实验,并且生理学过于复杂,以至于无法构建合适的人体计算机模拟来进行虚拟实验。但是,在大量医疗数据中,当AI医生想要对某位患者尝试某种药物时,我们可以浏览这些数据,找到具有与当前患者相似的症状和生命特征的实际病史患者,甚至找到这样的患者然后接受了相关药物治疗-因此AI医生实际上并没有进行新的实验来学习,

标签:人工智能
最新文章