现在,世界各个角落都是大数据的身影,它们为我们提供一种可学习模型,我们使用计算机和算法可以迅速地对其作识别。
学习能力是智能行为的一个非常重要的特征,但至今对学习的机理尚不清楚。人们曾对机器学习给出各种定义。学习是系统所作的适应性变化,使得系统在下一次完成同样或类似的任务时更为有效。学习是构造或修改对于所经历事物的表示。从事专家系统研制的人则认为学习是知识的获取。这些观点各有侧重,第一种观点强调学习的外部行为效果,第二种则强调学习的内部过程,而第三种主要是从知识工程的实用性角度出发的。
机器学习在人工智能的研究中具有十分重要的地位。一个不具有学习能力的智能系统难以称得上是一个真正的智能系统,但是以往的智能系统都普遍缺少学习的能力。例如,它们遇到错误时不能自我校正,不会通过经验改善自身的性能,不会自动获取和发现所需要的知识。它们的推理仅限于演绎而缺少归纳,因此至多只能够证明已存在事实、定理,而不能发现新的定理、定律和规则等。随着人工智能的深入发展,这些局限性表现得愈加突出。正是在这种情形下,机器学习逐渐成为人工智能研究的核心之一。它的应用已遍及人工智能的各个分支,如专家系统、自动推理、自然语言理解、模式识别、计算机视觉、智能机器人等领域。其中尤其典型的是专家系统中的知识获取瓶颈问题,人们一直在努力试图采用机器学习的方法加以克服。
机器学习的研究是根据生理学、认知科学等对人类学习机理的了解,建立人类学习过程的计算模型或认识模型,发展各种学习理论和学习方法,研究通用的学习算法并进行理论上的分析,建立面向任务的具有特定应用的学习系统。这些研究目标相互影响、相互促进。
图5-7 机器人
(一)机器学习十大应用场景
1.数据安全性
恶意软件是一个越来越严峻的问题。2014年,卡巴斯基实验室称,它每天检测到的新恶意软件文件数量达到32.5万。不过,以色列深度学习技术公司Deep Instinct公司指出,各个新恶意软件通常都有跟旧版本一样的代码——只有2%~10%的恶意软件文件出现迭代变化。他们的学习模型能够辨别那2%~10%的变异恶意软件,在预测哪些文件是恶意软件上有着很高的准确率。在其他情况下,机器学习算法能够发现云端数据如何被访问方面的模式,能够报告或可预测安全问题的异常情况。
2.个人安全
如果你要坐飞机或者出席重要的公共活动,你几乎肯定要排长队去等候安检。不过,机器学习正被证明是一项很有价值的安检资产,能够帮助避免误报情况,以及发现机场、体育场、音乐会等的人工安检人员可能会遗漏的东西。它能够大大加速安检流程,同时也能够提高人们在重要活动中的人身安全。
3.金融交易
许多人都非常渴望能够预测股票市场的走势,因为这样就能够占得先机大赚特赚。相比人类,机器学习算法要更接近于预测市场走势。很多知名的交易公司都在利用专有系统来预测和高速执行高交易量的交易。这些系统很多都依赖于概率,不过即便成功概率相对较低,如果交易量很高,又或者高速执行,也能够给那些公司带来丰厚的收益。在处理分析海量的数据和交易执行速度上,人类显然无法跟机器相提并论。
4.医疗保健
相比人类,机器学习算法能够处理更多的信息、发现更多的模式。有研究利用计算机辅助诊断技术(CAD)来研究患上乳腺癌的女性早期的乳房X线扫描照。对于52%的乳腺癌案例,该计算机识别该病的时间比正式确诊要早上足足一年。此外,机器学习能够被用来理解大群体疾病的风险因素。Medecision公司开发的算法能够通过鉴别8个变量来预测糖尿病患者可避免的住院治疗。
5.个性化营销推广
对顾客越了解,就越能够给他们提供好的服务,卖出的东西也就会越多。这是个性化营销的基础。也许,你曾碰到过这样的情况:在网上商店上浏览某件产品但没有买,过了几天后,在浏览各个不同的网站时都会看到那款产品的数字广告。这种个性化营销其实只是冰山一角。企业能够进行全方位的个性化营销,如具体给顾客发送什么样的电子邮件,给他们提供什么直效邮递和优惠券,给他们“推荐”什么产品。这一切都是为了提高交易达成的可能性。
6.诈骗检测
机器学习正变得越来越擅长发现各个领域的潜在诈骗案例。例如,PayPal正利用机器学习技术来打击洗黑钱活动。该公司用工具来比较数百万笔交易,能够准确分辨买卖家之间的正当交易和欺诈交易。
7.产品服务推荐
如果常常使用像亚马逊或者Netflix这样的服务,那你应该很熟悉机器学习的这一用途。智能机器学习算法会分析你的活动,并将其与数百万其他的用户的活动进行比较,从而判断你可能会喜欢购买什么产品,喜欢观看什么视频内容。这些推荐技术正变得越来越智能,例如,它们能够判断你可能是买特定商品作为礼物(而非买给自己),又或者识别出有不同电视观看偏好的其他家庭成员。
8.在线搜索
谷歌及其竞争对手正利用机器学习来不断提升旗下搜索引擎的理解能力,这可能是该技术最有名的使用案例。每一次你在谷歌上进行搜索,该程序就会观察你对搜索结果的响应方式。如果你点击最上面的那条搜索结果,且停留在该结果指向的网页上,那谷歌就可以断定你得到了你想要寻找的信息,该搜索是成功的。而如果你点击第二页的搜索结果,又或者没有点击当中的任何搜索结果而输入新的搜索词,那谷歌可以断定其搜索引擎没能给你带来想要的搜索结果——该程序能够从这一错误中学习,以便未来带来更好的搜索结果。
9.自然语言处理(NLP)
自然语言处理正被用于各个领域的各类令人兴奋的应用当中。有自然语言的机器学习算法能够替代客户服务人员,能够更加快速地给客户提供他们所需的信息。它正被用于将合同中艰深晦涩的法律措辞转变成简单易懂的普通语言,也被用于帮助律师整理大量的信息,提高案件准备效率。
10.智能汽车
IBM对汽车行业高管的调查结果显示,74%的高管预计智能汽车将会在2025年正式上路行驶。智能汽车将不仅仅整合物联网,还会了解车主和它周围的环境。它会自动根据司机的需求调整内部设置,如温度、音响、座椅位置等。它还会报告故障,甚至会自行修复故障,会自动行驶,会提供交通和道路状况方面的实时建议。
图5-8 智能汽车
(二)具体案例分析
1.AlphaGo——机器对人类的挑战
阿尔法围棋(AlphaGo)是一款围棋人工智能程序,由谷歌(Google)旗下DeepMind公司的戴密斯·哈萨比斯、大卫·席尔瓦、黄士杰和他们的团队开发。其主要工作原理是“深度学习”。这个程序在2016年3月与围棋世界冠军、职业九段选手李世石进行人机大战,并以4:1的总比分获胜。不少职业围棋手认为,阿尔法围棋的棋力已经达到甚至超过围棋职业九段水平,在世界职业围棋排名中,其等级分曾经超过排名人类第一的棋手柯洁。其主要工作原理是“深度学习”。
“深度学习”是指多层的人工神经网络和训练它的方法。一层神经网络会把大量矩阵数字作为输入,通过非线性激活方法取权重,再产生另一个数据集合作为输出。这就像生物神经大脑的工作机理一样,通过合适的矩阵数量,多层组织链接一起,形成神经网络“大脑”进行精准复杂的处理,就像人们识别物体标注图片一样。
这个程序主要包括四个部分:
(1)走棋网络(Policy Network)。给定当前局面,预测/采样下一步的走棋。
(2)快速走子(Fast Rollout)。目标和(1)一样,但在适当牺牲走棋质量的条件下,速度要比(1)快1000倍。
(3)估值网络(Value Network)。给定当前局面,估计是白胜还是黑胜。
(4)蒙特卡罗树搜索(Monte Carlo Tree Search,MCTS)。把以上这三个部分连起来,形成一个完整的系统。
阿尔法围棋是通过两个不同神经网络“大脑”合作来改进下棋。这些大脑是多层神经网络跟那些谷歌图片搜索引擎识别图片在结构上是相似的。它们从多层启发式二维过滤器开始,去处理围棋棋盘的定位,就像图片分类器网络处理图片一样。经过过滤,13个完全连接的神经网络层产生对它们看到的局面判断。这些层能够做分类和逻辑推理。
这些网络通过反复训练来检查结果,再去校对调整参数,去让下次执行更好。这个处理器有大量的随机性元素,所以人们是不可能精确知道网络是如何“思考”的,但更多的训练后能让它进化到更好。
第一大脑:落子选择器(Move Picker)。
阿尔法围棋的第一个神经网络大脑是“监督学习的策略网络(Policy Network)",观察棋盘布局企图找到最佳的下一步。事实上,它预测每一个合法下一步的最佳概率,那么最前面猜测的就是那个概率最高的。这可以理解成“落子选择器”。
第二大脑:棋局评估器(Position Evaluator)。
阿尔法围棋的第二个大脑相对于落子选择器是回答另一个问题。不是去猜测具体下一步,它预测每一个棋手赢棋的可能,再给定棋子位置。
图5-9 阿尔法围棋
这“局面评估器”就是“价值网络”,通过整体局面判断来辅助落子选择器。这个判断仅仅是大概的,但对于阅读速度提高很有帮助。通过分类潜在的未来局面的“好”与“坏”,AlphaGo能够决定是否通过特殊变种去深入阅读。如果局面评估器说这个特殊变种不行,那么就跳过阅读。
人类面对机器不能自大。以往顶尖棋手认为机器不可能具有围棋选手的灵感和创造力,但是事实上机器已经做到了。以现在的技术来看,在一些重复性的脑力劳动方面,机器已经开始有更强的能力。但是在创造力领域,机器目前还做不到,未来也许可以做到,现在机器在推理能力、认知、包括自我意识方面都是没有的。
人类需要思考两个问题。第一是如何与机器为伴?机器能够帮助人类做一些服务,完成一些简单的体力、脑力劳动,使得人类可以解放出来做更高级的事情。这是未来一定会发生的事情,也是在“互联网+”大的体系里面,需要去努力推动的方向。阿尔法这次的胜利,会激发大家对人工智能的信心信念,推动这项技术的发展和应用。第二,如果有一天机器比人类更聪明、水平更高,就需要重新反思人类和机器的关系。极端地来讲,甚至人造的机器未来取代人,也是人类一个整体的进化。
三类人群会从这件事情获得不同收获。第一类是围棋职业选手,他们受到极大的震动;第二类是程序员、工程师等技术人员,他们发现自己有更大的舞台;第三类是更广大的普通人、消费者或者是创业者,以一种重新审视的角度看到更多新的机会。
谷歌相信人工智能变成人类的一种服务,谷歌的DeepMind团队也是以提升机器智能为使命进行工作的,这和IBM深蓝的出发点和路径也是非常不同的。
《自然》杂志最近刊登了相关文章。如果单是一台机器下围棋这样一件局部的事,其实不足以上《自然》杂志,这不是多么大的发明。但是《自然》杂志认可这样的技术,不仅只是针对下围棋,这本身代表了人工智能提升到一个新的层次,有一个广泛的服务能力。因此,我们认为这次对弈将成为一个历史性的事件。
对中国来讲,我们要更加重视互联网背后前沿技术的研发能力,重视对尖端技术的资源投入。我们在发展互联网的时候,不能忘了背后的原动力。虽然中国人口众多,带来巨大的红利,但是技术需要我们更好地保护和支持。
2.苹果Siri——人类与机器的对话
早在几年前,苹果就已经成为了第一家在操作系统中整合智能助手的大型科技公司。Siri原来是该公司2010年收购的一款独立应用程序,那时连同他们的开发团队也一并收购了过来。Siri刚推出时,大家都很欣喜。但接下来的时间里,用户却因为它的缺点变得不耐烦了。它经常听错指令,这个缺点无论怎么修改都无法克服。
于是,苹果后来将美国用户的Siri语音识别系统改为使用神经网络技术为基础的新系统,该功能在2014年8月15日面向全球发布。之前的一些技术仍然在使用,比如“Hidden Markov Models”,但现在这套系统用上了最新的机器学习技术,包括深度神经网络、卷积神经网络、长短期记忆单元、门控循环单元和N-gram.当用户完成升级后,Siri看起来仍然一样,但它却有了深度学习技术的强大改变。下面,我们来看看Siri通过机器学习技术,究竟能为用户做些什么。
(1)Siri变身闹钟。
这应该是用户最容易想到的Siri的“正经”用法了。按住“Home”键,告诉Siri,“早上7点15的时候叫醒我”;想打会儿小盹,就说“40分钟后叫醒我”。只要准确地报上时间,Siri将是最好用的闹钟。
(2)用Siri寻找咖啡厅。
喝咖啡是很多上班族的习惯,一杯咖啡能够迅速地将人调整成工作状态。出门在外的时候,想找个咖啡厅?利用Siri就可以搞定这一切。告诉Siri,寻找离当前位置最近的咖啡厅即可。如果你没有附加更多的要求,Siri将反馈给还算不错的答案,很可能是告诉你最近的星巴克在哪里。如果星巴克还不能满足你的要求,还是用更专业的应用Help吧,它会给你更详细的答案。
(3)想去哪,Siri告诉你。
查找出行路线的过程中往往要输入不少文字。想省事的话,还是用Siri完成这一切。报上要去的地点,Siri会调用Google地图来寻找出行路线的方案。从测试过的这种用法的用户的反馈上看,Siri还没有出过什么差错,就像GPS那样好使。2016年9月14日,苹果iOS10正式版问世,易到是目前iOS10中首个支持Siri语音叫车的软件。Siri可以直接启动易到,并帮用户完成订车。
(4)用Siri播放随机音乐。
如果你厌倦了固定顺序的音乐播放列表,可以试着用Siri播放随机音乐。首先,你需要将喜欢的音乐导入到一个名为“最爱”的播放列表中。开始听音乐的时候,告诉Siri“放皇后乐队的歌曲”。紧接着,Siri就会在“最爱”列表中匹配皇后乐队的歌曲并将其播放。这样就实现了随机播放音乐的功能。
(5)发送短信,Siri代劳。
还在边走路边发短信?行路不安全不说,发短信还费劲,以后用Siri代劳吧。走路的时候,将iPhone放在耳边,告诉Siri“用短信告诉她,我将晚点到家”。不用匆忙,告诉Siri你想表达的内容,即可轻轻松松地发送短信。
(6)天气预报,Siri知道。
这也是Siri十分擅长的一项功能。关于气象信息的问题,Siri都能正确理解。想要知道明天的天气怎样,问问Siri就知道了。
(7)用Siri提醒日程安排。
既然能把Siri当闹钟用,你当然可以用它来提醒日程安排。很多人都有使用Google日历的习惯,用Google日历安排自己的各项日程。生活中的一些需要提醒的小事,完全没有必要一项项地加到Google日历中去,用Siri就可以搞定这个问题。比如说,“十点钟的时候,提醒我去刷牙”。
(8)用Siri提醒地点。
Siri提醒地点的功能还不是很完善。除了“家”或“上班处”,Siri对于一些位置称呼的理解能力不佳。但是,Siri对“这里”的理解十分准确,即当前的GPS坐标位置。所以你可以这样用Siri的提醒功能,途经一家不错的小店时,可以将它的位置标记为“这里”并设置好提醒,以便日后有时间时再次光顾。
(9)Siri为你答疑解惑。
珠穆朗玛峰多高?美国的GDP是多少?回答不上来的话,无需谷歌,张嘴问问Siri吧。Siri本身是不知道这些问题的答案的,它会从“知识问答引擎”Wolfram Alpha中寻找答案。所有的回答都会以自然语言的形式呈现。这也是Siri被认为将对谷歌重要威胁的原因。当然,Siri在相当长的一段时间肯定不能取代谷歌,但对谷歌的威胁将是长远的。当Siri足够智能的时候,人们用它取代谷歌并不是没有可能。
如果你是iPhone用户,那么你已经接触过苹果的人工智能,而这并不仅仅是Siri能够准确地理解你的意图。你可以看到,如果来电号码不在通迅录中,那么手机将会进行识别;如果你侧滑屏幕,那么可以看到最常用的应用列表;你在“提醒事项”中标记的没有放进日程表的约会,它会提醒你;如果你预订过某家酒店,那么酒店位置会在地图上自动显示;甚至手机会告诉你车停在哪里。这些技术都来自于苹果对深度学习和神经网络的使用。
即使苹果正在全面拥抱机器学习,但苹果高管仍表示,这对苹果来说只是普通的业务行为。他们表示,深度学习和机器学习只是一系列突破性技术的最新一环。它们拥有改变事物的能力,但并不一定超过一些其他技术优势,比如触屏、平板电脑、面向对象的编程技术等。在苹果眼里,机器并非其他公司口中的“人机交互终极目标”,与其他公司不同,在苹果看来,机器学习并不是最后的前沿。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。