当前位置 >> 首页 >> 学习园地 >>  科普知识

科普知识

获图灵奖的深度学习到底是什么?

它可能会彻底改变我们的生活!

稿件来源:中信出版集团 责任编辑:ICAC 发布时间:2019-04-02

  编者按

  北京时间3月27日晚,ACM(美国计算机协会)宣布把2018年度图灵奖颁给了深度学习“三巨头”——加拿大蒙特利尔大学教授约舒亚·本希奥(Yoshua Bengio)、谷歌副总裁杰弗里·欣顿 (Geoffrey Hinton) 和 纽约大学教授扬·莱坎 (Yann LeCun),以表彰他们在深度学习神经网络上的工作。

  要知道,有关人工智能神经网络的想法在上世纪50年代就被提出,但后来一度遇冷,在质疑声中仍坚持相关研究的人实在屈指可数。这三位科学家一直在一片不看好下坚持到了今天,并带来重大突破,如今相关方法成为研究主流。

  “深度学习”这四个字对于普通人来说多少有些遥远,很多人会问“深度学习”关我什么事呢?其实,它和我们的生活的各个方面都息息相关。

什么是深度学习?

  举个简单的栗子,如果你在联网的手机或翻译平台上使用了语音识别功能,你其实是在与经过深度学习训练的神经网络进行交流。

  听起来有点不可思议吧,但其实深度学习是机器学习的一个分支,它根植于数学、计算机科学和神经科学。深度网络从数据中学习,就像婴儿认知周围世界那样,从睁开眼睛开始,到慢慢获得驾驭新环境所需的各种技能。

  深度学习的起源可以最早可追溯到20世纪50年代人工智能的诞生。

深度学习与我们有什么关系?

  AI医疗

  随着机器学习的成熟并被应用于可获取大数据的许多其他问题,各个行业也将发生转变,首当其冲的便是AI医疗的应用。

  基于数百万患者病情记录的医学诊断将变得更加准确。

  最近的一项研究将深度学习运用到了囊括超过2000种不同疾病的13万张皮肤病学图像中,这个医学数据库是以前的10倍大。计算机对新患者医学影像的诊断与21位顶级皮肤科专家的结论基本一致,甚至在某些情况下还要更准确。

  试想一下,在不久的将来,看皮肤病就2步——对疑似患病部位拍照、上传立即进行诊断。任何一个拥有智能手机的人都可以完成。而现在要完成同样的过程,至少需要4步——先去医院,挂号排队,看医生,等诊断结果。

  AI医疗的运用使得我们可以很快得到专家诊断,我们会在皮肤病(或者再扩大一些,其他同样适用的病)的早期阶段,也是更容易治疗的阶段就开始就医,而不是现在一想到去医院就头大,一拖再拖错过了最佳治疗时期。同时,对医生来说,借助深度学习,医生将能更准确地诊断罕见的皮肤病。

  不单是皮肤病,借助深度学习的诊断,医生可以将癌症诊断的准确度从0.966提高到0.995。不要小看这一点点进度,惠及的可是千万人的生命。届时,误判的情况将大大减少,更多生命将被挽救。在未来,每个人都将是AI医疗的受益者。

  自动驾驶

  不久之前,人们还常说,计算机视觉的辨别能力尚不如一岁大的孩子。如今看来,这句话要改写了。计算机不仅能和大多数成年人一样识别图片中的物体,在马路上驾驶汽车的安全性还高过16岁的青少年。

  更神奇的是,如今的计算机不再是被动按照指令识别和驾驶,而是像自然界的生命由数百万年前开始进化那样,自主地从经验中学习。

  最终,如果一辆自动驾驶汽车能够在一分钟内出现,将你安全带到目的地且无须停车,在城市拥有汽车就显得不那么必要了。

  今天,汽车行驶时间平均仅占4%,这意味着它其余96%的时间都需要停放在某个地方。由于自动驾驶汽车可以在城市外围维修和停放,城市中被大量停车场占用的空间将得以重新高效利用——让停车场变成公园、绿地、图书馆这些公共设施,街边的停车道也可以成为真正的自行车道。

  其他汽车相关行业也将受到影响,包括汽车保险业和修理厂。超速和停车罚单将不复存在。由醉驾和疲劳驾驶导致的交通事故死亡人数也会相应减少。通勤浪费的时间也将被节省下来做其他事情。

  专家们预计,卡车会在10年内实现自动驾驶,出租车要花上15年,15~25年后,客运无人车将全面走入我们的生活。

  你期待那一天的到来吗?

  智能翻译+语音识别

  语言翻译是人工智能的一只圣杯,因为它依赖于理解句子的能力。

  谷歌最近推出了基于深度学习的最新版谷歌翻译(Google Translate),代表了自然语言翻译质量的重大飞跃。几乎一夜之间,语言翻译就从零散杂乱的拼凑短语,升级到了语意完整的句子。

  也许有一天,机器能够通过整合莎士比亚的所有诗歌来翻译他的作品。

  人工智能的另一只圣杯是语音识别。

  这一突破性成果将在之后的几年渐渐影响我们的社会和生活,计算机键盘会被自然语言接口取代,以前动手的,现在动口就可以了。正所谓君子动口不动手。

  随着数字助手,如亚马逊的Alexa、苹果的Siri以及微软的Cortana先后进入千家万户,这种取代已经在发生了。就如随着个人电脑的普及,打字机退出了历史舞台一样,会不会有一天电脑键盘也将成为博物馆的展品?

  语音识别和语言翻译结合到一起时,实时的跨文化交流将变为可能。电影《星际迷航》中那种万能翻译机将触手可及。

  社交机器人+情绪识别

  电影里经常将人工智能描述为像人类一样走路和说话的机器人,不过目前看来,人工智能的进展主要集中在感官和认知方面,运动和行为智能的进展相对缓慢。

  加州大学圣迭戈分校神经计算研究所机器感知实验室发明了一个著名的社交机器人Rubi。Rubi的头可以旋转,眼睛是相机,嘴和眉毛都十分富有表现力。Rubi头顶上浓密的光纤会随着它的心情而改变颜色。18个月大的幼儿可以通过Rubi腹部的平板电脑与Rubi进行互动。

  你的面部表情是你脑内情绪状态的窗口,深度学习现在已经可以探进这个窗口了。

  艾克曼是世界著名的面部表情专家,是美剧《别对我撒谎》中男主卡尔.莱特曼博士的原型。艾克曼开发了面部动作编码系统来监控面部44块肌肉的状态。

  面部表情是动态的,一般可以延续若干秒,但是艾克曼发现,有些表情只持续了几帧。这些“微表情”是受到抑制的大脑状态的情感泄漏,常常很能说明情感状态,有时会揭示无意识的情绪反应。

  例如,大数据告诉你,突然快速眨巴眼睛,耳朵轻微的颤动,脸上肌肉突然抽搐几下,下意识地摸摸鼻子,头不自觉的微微摆动,一边说话时一边耸肩,脚来回扫地——这些细微表情和动作,都是撒谎时的无意识表现。

深度学习的其他深度影响

  法律

  深度学习刚刚开始影响法律界。以后辅助审核或调查将慢慢被人工智能接管,它可以浏览数千份文件以获取合法证据,且丝毫不会感到厌倦。自动化深度学习系统将为现在无法负担高昂律师费用的普通人提供法律建议。法律工作不仅收费会更便宜,也会更高效。

  投资

  机器学习正在推动算法交易,它比传统的长期投资策略更快速,比股票市场中的高频交易更加慎重。许多不同类型的机器学习算法被组合运用以获得最佳回报。以后手头的钱需要怎么投资才能获得理想回报,你可能需要问问你的手机。

  竞技

  一个名为“DeepStack”的深度学习网络和33名德州扑克职业选手进行了4万多场比赛。令扑克专家震惊的是,在德州扑克这种诈唬、欺骗技巧和拿到的牌一样重要的游戏里,它以相当大的优势击败了最出色的扑克玩家。

  这意味着,如果这一成就能复制到其他基于不完全信息、需要人来做判断的重要领域,比如政治学和国际关系,其影响可能是极其深远和颠覆的。

附件:
相关新闻:
赛迪研究院:人工智能芯片技术和产品发展势头迅猛