登录

/

注册

首页 > 科技媒体 > 媒体详情
【机器学习】Google 开源机器学习系统TensorFlow
柏岩 2015-11-10
导语

11月9日,Google CEO Sundar Pichai 在 Google 官方博客上宣布开源 Google 的机器学习系统 TensorFlow,任何研究者包括竞争对手都可以使用。11月10日举办的沟通会上,Alphabet 执行主席埃里克·施密特连线表示,开源 TensorFlow 不断扩大机器学习网络,组成更大的知识基础,获得更多回馈,进而有更多发现。

Google 将自己的技术免费开放,希望可以加速机器学习领域的发展,所有研究者都会帮助该领域整体向前,并将成果反馈回来。而越来越多数据进入,反过来也有助于帮助 Google 自己的系统来修正模型,加速学习效果。

机器学习领域被寄予了高度重视,已经成为 Google 内部第三重要的领域,它的研究进展将支撑 Google 多个业务。

目前机器学习已在 Google 多个产品上应用,例如在 Gmail 中机器来判断是否为垃圾邮件;从大量图片中识别出显示的物体是什么,比如搜索与猫类似的猫咪图片,Google 能将没有人工标注是猫的照片呈现出来;Google 翻译中的图像识别翻译、Youtube 中推荐视频都有机器学习在其中。在上周发布的 Gmail 自动回复功能中,也使用了机器学习,系统能够自动判断是否需要回复,如果系统判断需要回复,会给用户三个简短答复,用户可以直接发送或者编辑修改后发送邮件。

Google Photos 产品经理 Chris Perry 以该产品举例,在 Google Photos 中,机器可以根据人、地点和事物等等将用户所拍的所有照片进行整理分类,用户并没有对照片进行人工文字标注和分类,但是 Google Photos 会自动根据不同维度对照片进行分类,比如人像、自拍、风景等等。当用户搜索比如 “父亲、远足” 关键词时,Google Photo 会把几年前你与父亲一起远足的照片找到。

机器学习的原理概要地说是通过不断获取数据对模型(简单理解类似 y=ax+b 这样的公式,但实际上没有这么简单)进行调整,最终能形成一个可靠的模型,给一个输入变量后能得到一个靠谱的结果。举个例子,当机器经过大量数据不断修正 “参数”(类似公式中的 a 和 b)将模型训练好后,即使机器不懂什么是猫这种生物,也能给出用户想要的猫的结果,例如猫的图片。而不断调整的过程,用户也可以参与其中。用户上传大量关于猫的图片就能帮助机器识别什么是猫。大量数据对于训练模型至关重要。

过去人们对于程序的做法是设定规则,告诉机器按照这个规则去做,类似 IF “条件” then “结果”,比如电子邮件如果包含 “V!agra” 这样字就判定为垃圾邮件。而在机器学习领域,我们建立程序从例子中学习,例如对邮件进行分类(用户报告是垃圾邮件),模型根据用户点击结果不断改变自己,减少错误,反复循环这个过程,无意间实现了自我进化。

用户在报告垃圾邮件的过程就相当于是帮助机器自我调整参数,如果用户在搜索猫的图片时,真正显示是猫的图片终将会被用户大量点击,而不是猫的则点击很少,包括用户行为在内的持续的动态修正过程一直在帮助机器变得更精明。

由于计算能力在最近几年的提升,过去十几年前就已存在的机器学习的点子将得以实现落地。机器学习领域发展很快,但仍需要更多的研究。Google 研究员 Greg Corrado 称,“我们鼓励大家从不同角度研究机器学习,即使是在 Google 内部也有从不同角度研究的路径。目前,学术界的研究和业界差异也很大。”

“Google 约 2010年 在移动设备上开始应用机器学习。机器学习自 5年 前在实验室诞生之际起,至今已有超过十亿的用户。机器学习开始从理论转向实际,今天 Google 所有的核心产品都在利用机器学习来为用户提供更快速、更智能也更便捷的服务。 ” 埃里克·施密特说。

随着 Google 本身对机器学习系统 TensorFlow 的开放,可预见今后该领域进展产品化将加速出现。

Google机器学习TensorFlow发展史:

谷歌内部深度学习结构DistBelief开发于2011年,它让谷歌能够针对数据中心的数千核心,构建更为大型的神经网络和规模训练,典型的应用像是提升谷歌应用中的语音识别能力,以及为谷歌搜索加入图片搜索功能。

不过DistBelief存在一些限制,比如说较难设置,而且和谷歌内部接触设施紧密结合——这就没法很好地分享研究代码了。

所以Google Research宣布推出开源的TensorFlow,这是谷歌的第二代机器学习系统,对于DistBelief的短板做了补足。TensorFlow灵活性佳、可移动、易于使用,而且是完全开源的。基于DistBelief的速度、可扩展性和为产品做准备的特性,TensorFlow做得更为出色。按照谷歌所说,在某些基准测试中,TensorFlow的表现比DistBelief快了2倍。

TensorFlow内建深度学习的扩展支持,不止于此——任何能够用计算流图形来表达的计算,都可以使用TensorFlow。任何基于梯度的机器学习算法都能够受益于TensorFlow的自动分化(auto-differentiation)。通过灵活的Python接口,要在TensorFlow中表达想法也会很容易。

除了在研究方面,TensorFlow会很有帮助,对于实际的产品也是很有意义的。将思路从桌面GPU训练无缝搬迁到手机中运行。使用谷歌的样本模型架构,就能很快地开始使用机器学习技术——谷歌正计划在TensorFlow之上发布ImageNet计算机视觉模型。

如若转载,请注明e科网。

如果你有好文章想发表or科研成果想展示推广,可以联系我们或免费注册拥有自己的主页

  • 机器学习
  • TensorFlow
分享到
文章评论(3)
柏宝红[北京航空航天大学]

Google实力很强啊,不过开源已经成为趋势,利人利己

3311天前 | 回复
柏岩[北京航空航天大学]

Google是想让TensorFlow成为人工智能领域的Android 的节奏啊

3312天前 | 回复
柏岩[北京航空航天大学]

Google是想让TensorFlow成为人工智能领域的Android 的节奏啊

3312天前 | 回复
登陆后参加评论
作者 柏岩

硕士生

北京航空航天大学

活跃作者
  • 爱因斯坦 科研工作者 北京航空航天大学 博士
  • 金陵 本科生 北京大学 本科
  • 梅西 本科生 北京工业大学 本科


发布成功!

确 定 关 闭