本文共 3029 字,大约阅读时间需要 10 分钟。
编者按:我们和电脑之间的交流正在发生着转变,而深度学习也已经润物细无声地进入我们的生活,甚至在你意识到这一点之前,世界已经截然不同。
本文首发于,分上下篇,由老吕IO、江小片及何忞联合编译,未经雷锋网(公众号:雷锋网)允许不得转载。
深度学习技术诞生已经几十年了,在蛰伏一段时间后,它现在又迎来了第二春,成为了计算产业的新加速器,未来它还将彻底改变美国企业的面貌。
过去四年里,恐怕读者们都能清晰的感觉到技术的提高对我们日常生活的影响。其中,最明显的就是智能手机中语音识别功能的大跃进。它确实比以前好用多了,至少你命令它给自己媳妇打电话时不会无意间拨给前女友了。
事实上,我们与电脑间的交流方式正在发生转变,原本噼噼啪啪敲个不停的方式正在被一众段子手语音助手所替代。百度数据显示,在过去的一年半中,用户使用语音交互的频率提高了三倍。
机器翻译和其他方式的语言处理也正在变得越来越准确,谷歌、微软、 Facebook 和百度每个月都会会有小小的进步。眼下,谷歌已经能在瞬息之间将普通口语翻译成其他 32 种语言,在文本翻译方面它更是覆盖了 103 种语言,在无意间还成了许多即将消失语言的保护神。同时, Gmail 应用的收件箱还贴心的准备了三种预制回复,处理普通的邮件来往完全够用了。
此外,图片识别技术也有了巨大的进步。上面提到的四家巨头已经可以在缺乏识别标签的情况下帮用户找到他们想要的图片了。你甚至可以让它们专门找出带有狗狗、雪花甚至拥抱的图片。另外,未来图片识别技术还将拥有看图说话功能,它们能在眨眼间为你描述图片中的内容。
不过,想达到这样的效果可不容易,首先应用需要分清各种种类的狗狗,其次它要区分那些上下颠倒或者模糊的图片。此外,图片中的背景也会形成干扰,万一来个雾霾“宝宝”可就苦了。最后,应用还得排除那些长得比较像狗狗的狼和猫。而这一复杂的过程全靠分析像素完成,实在是太惊人了。
图1:神经网络是如何识别图片中的狗狗的
除了社交应用,图片识别技术还顺道照顾了下其他领域的感情。一些医学新创公司表示它们很快就能利用电脑来分析 X 光、核磁共振和 CT 扫描的结果了,整个过程将变得更快更准,放射科的老医生也得甘拜下风。此外,电脑还能提早发现癌细胞的存在,为病人争取更多的治疗时间。同时,新技术也是救命药物研制中的好帮手。
机器人、无人机和自动驾驶汽车等也是图片识别技术的受益者,未来这些产品将彻底改变我们的生活方式。
不过,就在你忙着献上膝盖的时候,恐怕不知道它们在本质上是一种突破。其背后真正的大魔王其实就是人工智能技术,也就是我们所说的深度学习,另外它还有个学名叫做深度神经网络。
要说深度神经网络到底强在哪,恐怕其强悍的自学能力才是最佳答案。计算机技术发展到现在,没有哪个程序员能直接编出一个程序或算法来完成上面提到的任务。他们只能为电脑打造一个学习算法,日夜不断的用数据“喂养”它,而主导这一学习过程的并不是投喂数据的人类,而是电脑自己,它们会遨游在数据的海洋中自主完成学习任务。
“从本质上来说,软件已经学会自主开发新软件了,”英伟达公司 CEO 黄仁勋说道,该公司五年前做了一个大赌注,它正从一家我们熟悉的显卡公司转变为深度学习技术巨头。
深度神经网络的概念其实早就不新鲜了,其历史可追溯到上世纪 50 年代,而大多数的关键算法突破这发生在上世纪 80 和 90 年代。现在这一概念重新走向前台,主要是因为我们拥有了强悍的计算和数据存储能力,互联网上的图片、视频、音频和文本都成了“养料”。顶级风投 Andreessen Horowitz 的合伙人 Frank Chen 认为,“深度学习迎来了属于自己的寒武纪大爆发,”各种高等级生物在一夜间萌发了出来。
这一巨大的转折点也点燃了许多人的激情。研究公司 CB Insights 的数据显示,上个季度, AI 新创公司的融资额再创记录,突破十亿美元。 2016 年第二季度,此类公司共完成了 121 轮融资,而 2011 年同期这一数字仅有 21 轮。 5 年之间,投入 AI 领域的资金达到 75 亿美元,而其中 60 亿都是 2014 年后才入场的。
2012 年时,谷歌只有两个深度学习项目,但现在这一数字已经膨胀到超过 1000 个。同时这些项目也是遍地开花,谷歌旗下的搜索、安卓、 Gmail 、翻译、地图、 YouTube 和自动驾驶汽车都是其受益者。
此前, IBM 的 Waston 系统只靠 AI 就能在各种比赛中称王,但现在它们也顺应潮流用上了深度学习, Waston 旗下的 30 个构建服务项目都通过该技术得到了增强。
五年之前,恐怕没几家风投懂得深度学习为何物,但现在如果新创公司不懂这项技术,它们投资前就会非常犹豫。“我们生活在一个新时代,” Frank Chen 说道。“复杂的软件应用成了必备品。人们很快就会意识到这一巨大转变,未来人类之间的对话也会围绕它们展开。”
微软研究院的 Peter Lee 认为,许多公司已经将深度学习技术整合进了自己的日常流程。“我们的销售团队就在利用神经网络预测产品前景并根据用户特点进行精准推荐。”
深度学习技术的快速发展也震动了硬件产品的世界,摩尔定律不再是无可辩驳的真理,英伟达的 GPU 也能成为计算能力的倍增器。对深度学习计算来说,这种原本用来渲染 3D 游戏的产品比传统 CPU 的效能高 20-50 倍。
今年八月份,英伟达新一季财报显示,该公司数据中心部门的营收同比翻番,达到 1.51 亿美元。该公司CEO 认为,“该部门营收能取得巨大进步主要靠的就是深度学习。”在总长仅有 83 分钟的财报电话会议上,“深度学习”一词更是破纪录地出现了 81 次。
芯片巨头公司英特尔也受到了影响,在上两个月中它并购了两家做深度学习计算的初创公司:Nervana System(超过 4 亿美金)和 Movidius (未公布价值)。
关于这一点,Google在五月份表明去年他们使用定制芯片——张量处理器(TPUs)来通过深度学习实现应用程序。张量是像矩阵这样的一列数字,在深度学习计算中通常用一个乘以另一个。
实际上,公司现在已经处在转折点上。百度研发中心的首席科学家 Andrew Ng 说:“过去许多标准普尔500的首席执行官都希望他们能抢先应用因特网,我想未来五年会有更多的首席执行官希望能及早的应用人工智能。”
尽管现在因特网还不能使利用人工智能的深度学习的价值得到充分利用,但 Andrew Ng说:“100 年以前电力的出现改变了工业时代,那么现在人工智能就充当着电力的角色。”
深度学习只是小小的一部分,人工智能包含了许多技术,例如传统逻辑算法系统,利用这种系统能使计算机和机器人像正常人类思考那样解决问题。深度学习是机器学习的一个分支,机器学习听起来不好理解,但是对于让计算机根据经验解决问题来说,机器学习是很重要的数学算法。
百度的 Ng 说:“举个例子来说,深度学习就像是 A 到 B 的映射,你输入音频,然后就可以听到副本,这就是语音识别。只要你有数据运行软件,就都有可能完成。”他补充说:“如果你收到邮件,它就会识别是否是一封垃圾邮件。如果收到贷款申请,它就会预计客户偿还的概率。如果询问驾驶路线,它就会告诉你接下来该怎么走。”
推荐阅读: