人工智能vs人类智能小传
Alphago代表的深度网络人工智能体现了AI逐步进入未知领域的强大能力,因此有人堪忧有人喜乐,却极少有人戳中要害。说AI比人牛是因为它下围棋比人厉害? 说AI离真正的智能很遥远是因为它不能创造吗?是因为它只擅长形式逻辑?是因为它没有自我意识?而深度网络代表的这波人工智能风潮代表的是一种局部的演进,还是未来的一扇大门打开?
网络上各种似是而非的谣言其实了表现了我们连生物的智能都不了解。我们回顾一下神经科学和AI的历史,从脑和智能的演进来看这个所谓的人工智能有多聪明。
要谈这个问题,我们就需要从智能说起,智能其实分为三个层次,对应丹内特对意识进化的三个分级:达尔文式造物,斯金纳式造物,波普尔式造物。
智能的第一个层次是进化(达尔文式),而不是自我意识这些高端装逼的东西。智能的起点是学习,学习即对环境变化做出相应对策。整个生物进化过程,就是学习的过程。为什么呢? 你一个小小的细菌,也可以对环境做出趋利避害的反应,并且通过基因突变的方法有点盲目的适应环境,这其实就是用遍历法来选择针环境变化的最佳生存策略,然后通过遗传以及下一代继续试错,将某种策略强化。
阿法狗的策略网络也是类似的道理, 通过对可选策略集合的分析进行局部最优的调整。 细菌和十亿年的的恶略环境下棋,把对哪些化学物质该如何转化这个信息深深的埋藏在了它的DNA里,因此才可以有如今如此从极地到大漠的如此伟大的适应性。大自然的这种学习方式可以看做智能1.0版, 缺陷是速度慢和读取数据量小。我们人类模仿进化的过程创造了进化选择算法, 作为人工智能一个非常基础的部分。
智能1.0 版 进化算法 - 遍历所有可能并加以选择,最终得到最适合环境的策略,被动但是在历史长河里极为有效 。
达尔文智能主宰了漫长的生物进化史的大部分岁月, 使得单细胞生物逐步具有越来越复杂的性能。
阿尔法狗的策略网络(蒙特卡洛树搜索)-- 细菌级别的智慧, 20年前的深蓝却使用它打败了人类国际象棋大师。
下面我想说的是第二阶段的智能,斯金纳(伟大的行为心理学家)式造物。 斯金纳式造物说的是生物自己能够自主的去学习而非被动的靠基因变异适应环境。 这项伟大的创举背后就是大名鼎鼎的神经网络,生物进化几十亿年的历史都是这种被动的适应环境,直到神经网络的出现一切才悄悄发生变化。
神经网络的作用简单来看,就是一个分类器,它可以把外界刺激分成好的和坏的,并且趋利避害。拥有这个分类器, 动物终于可以在自然环境面前主动做决策, 并且趋利避害。把狮子放在要躲避的那一堆, 异性放在要接近的那一堆对于动物的生存意义之重大不言而喻。 这个分类器最开始是储存一些先天的条件反射,比如婴儿见到目前的乳头就要吸。而后来就出现了后天习得的条件反射,比如著名的巴甫洛夫的狗,听到铃声就会分泌口水。没错, 后天形成的条件反射-就是学习的2.0版。
然而生物神经网络是如何实现这一调整的,却一直是个迷,直到1940年Hebb提出神经科学的牛顿定律-Hebbian learning rule,人们开始了解神经网络是如何实现这一步骤。Hebb说组成神经网络的神经元通过不停的调整之间的突触连接来改变对外界刺激的反应,这个变化法则就是同时放电的神经元连接加强(细节来看还与放电的顺序有关)。这就使得被一起激活的神经元形成一个基团,比如狗听到铃声以后被喂食,那铃声这个刺激之前狗可能没有任何反应,而之后就被划分到午餐那一类, 从而形成对铃声的条件反射。
阿尔法狗深度学习的基本原件人工神经网络也是一个人为敲定的分类器, 用于做决策。 人工神经网络的训练过程同样借鉴了生物神经网络的学习过程, 根据反馈调整神经元之间连接的权重关系, 来实现对外界信号分类方法的改变, 因此调整决策(reinforcement learning 强化学习)。
生物形成新的条件反射,可以理解为一个决策的生成, 用二进制表述后成为分类问题。
分类问题可以由神经网络解决:
上图的神经网络, 就是一个基本的卷积网络, 把输入的值乘以一定权重在加在一起, 再通过一个非线性的阶梯函数, 转化为0(有害),1(有利)的输出, 即决策过程。
学习, 数学上叫调参: 改变w的数值即可改变分类的方法(界限)。
训练的过程, 图中为一个分类野生和家养动物的网络,随着数据量的加大分类越来越准确。
神经网络的分类功能, 把输入的信息(环境变化)分为有利和有害的进行决策, 环境的变化越复杂, 越体现神经网络可以任意的通过改变连接强度来调整决策“界面” 的优势, 而不需要用进化的方法上下一辈来适应环境(学习的重要性)。 当然这个学习过程需要大量数据的训练。
结论: 一个单层神经网络完全可以娴熟的应用斯金纳造物 从第二种智能方式我们依然可以看到, 生物智能的方式是如何启发了人工智能。
智能的最高级形式波普尔造物,对外部世界进行表征,形成认知,信念和预期,则对应神经网络的更高级功能。如果仔细思考,,我们会发现这些很多包含在阿法狗使用的深度网络里。首先,深度网络最擅长的是对事物进行抽象(深度学习),在最靠近输入的层次上, 每个细胞就如同数码相机CCD上的像素,之后的每一层次都比上级网络的感受野要大,而最终得到的效果是最深层的神经元直接处理和图像的全貌相关的特征,比如照片上的人是谁。如果换到其他地方,就是从抽象或全局特征进行决策。
这个结构像极人类社会的结构, 越是高层, 越能把握和总控全局。深度网络上的“抽象概念”这个认知武器,使得阿尔法狗有对全盘棋的趋势进行判断的能力,可以迅速舍弃一些错误的方向,减少搜索的深度,即价值网络。其实人脑所使用的算法和阿尔法狗差距没有那么大,记得前些年有一篇著名的science文章说人类发现在高级脑区表现抽象概念-如人名的细胞,这是符合这种深度网络逐层抽象的概念。高级脑区正是对应人脑深层网络的最底层。
阿尔法狗此次能够战胜代表棋牌巅峰智慧的围棋冠军这件事最大的意义,也在于深度网络赋予了AI自主判断局势和形成策略,而不是靠之前的仅靠人为给定的策略遍历所有可能。或者说深度网络打开了波普尔造物的大门
当然,深度网络算法只是提取了生物神经网络的一个主要特征 , 而几亿年进化结晶的人脑, 由于计算机能够提取并用于学习的数据量巨大, 使得它能够在学习了人脑的一个雕虫小技之后通过迭代学习迅速在某个特定任务上超越人类。
波普尔式的智能-深度网络