登录

/

注册

首页 > 科技媒体 > 媒体详情
北京大学计算机所与今日头条实验室联合研发推出AI写稿机器人
金陵 2016-08-17
导语

近日,北京大学计算机所万小军团队与今日头条实验室联合研发推出新一代AI写稿机器人-奥运AI小记者Xiaomingbot,这是国内第一款综合利用大数据分析、自然语言处理与机器学习技术的人工智能写稿机器人,短短几天已经为里约奥运会的女足、乒乓球、网球、羽毛球等赛事自动撰写了数百篇简讯与资讯,吸引了大量用户访问与阅读。

里约奥运会开赛一周,AI机器人「张小明」通过对接奥组委的数据库信息,实时撰写新闻稿件,以跟电视直播几乎同时的速度发布稿件。这是国内第一款综合利用大数据分析、自然语言处理与机器学习技术的人工智能写稿机器人,短短几天已经为里约奥运会的女足、乒乓球、网球、羽毛球等赛事自动撰写了数百篇简讯与资讯,吸引了大量用户访问与阅读。


张小明是北京大学计算机所(万小军团队)与今日头条实验室(李磊团队)联合研发的AI机器人,可以通过两种文本生成技术产出新闻:一是针对数据库中表格数据和知识库生成自然语言的比赛结果报道,即简讯;二是利用体育比赛文字直播精炼合成比赛过程的总结报道,即资讯。

来看看张小明写的简讯:

“丁宁本轮的对手是现世界排名第7的韩英,实力不俗。但经过4场大战的激烈较量,最终,丁宁还是以总比分4:0战胜对手,笑到了最后,为中国延续了在这个系列赛事中最终夺冠的机会。“

据了解,张小明平均每天产出30-40篇稿件,以短讯为主。截至目前,张小明的《奥运会乒乓球女单铜牌赛金宋依(朝鲜)4:1奥运名将福原爱(日本) 轻松摘铜》,在头条号获得超过5.4万用户的阅读量。

除了短讯,张小明还能撰写长文资讯:

全篇821个字,张小明通过数据库对接、信息搜集、文本生成、润色完成报道,最后发布、推送到今日头条手机客户端。

张小明到底是什么来头?

张小明,英文名Xiaomingbot,是今日头条头条实验室的研发成果,其「写稿」模块是由头条实验室与北京大学计算所(万小军团队)联合研发而成。这是国内第一款可以报道奥运赛事的人工智能机器人,在结合了最新的自然语言处理、机器学习和视觉图像处理的技术之后,通过语法合成与排序学习生成新闻。

款写稿机器人不仅可以基于实时赛事数据与知识库生成比赛简讯,还可以基于体育比赛文字直播精炼合成长达上千字的比赛总结报道,即资讯。其中,基于体育比赛文字直播进行新闻资讯生成的成果已经以长文形式发表在自然语言处理顶级国际会议ACL2016上,并已申请相关专利。

相比于第一代写稿机器人的进步之处

相比国内第一代写稿机器人——腾讯的「Dreamwriter」和第一财经的「DT稿王」,张小明的写稿技术已经进入是第二代写稿水平。与第一代机器人相比,张小明特征显著:

1.速度快数据库数据更新的2秒之内,即可生成新闻稿并完成发布。

2.样式多既可以生成长的详细比赛描述总结,也可以生成简明扼要的快讯简报,以前的自动体育新闻只能生成较短的文章。

3.自适应根据比赛选手的排名,赛前预测与实际赛果的差异,比分悬殊程度,可以自动调整生成新闻的语气,并使用感情色彩的词语,如“实力不俗”、“笑到了最后”等。

4.自动配图以前的自动新闻都只能生成文本,通过自动选图技术,张小明可以给新闻配图,更加生动形象。

AI机器人“张小明”的意义

“张小明并非想取代记者。相反,新闻机器人是记者的助手,可以帮助记者更高效的完成新闻报道工作。”头条实验室负责人李磊博士说道:

“张小明最大的意义在于,面对奥运会这样同时举行上百场比赛的综合赛事,记者很难关注到每一场比赛,而机器人可以任劳任怨的为每一场比赛报道,无论这场比赛多么冷门和不重要。传统新闻理论并不认为这些冷门比赛或者热门比赛(比如乒乓球)的前几轮小组赛有新闻价值,可是通过我们的平台测试,我们发现对冷门场次的报道任然有可观的阅读量,这个阅读量非常长尾,而新闻机器人可以弥补对这种长尾的新闻需求。”

奥运会进行到第五天,已经有超过25万用户通过张小明的报道获取赛事战报,他还在孜孜不倦地,以2秒种的生成时间,发布着每一场赛事的新闻稿。

文章链接:

Jianmin Zhang, Jin-ge Yao and Xiaojun Wan. “Toward Constructing Sports News from Live Text Commentary," In ACL 2016.

万小军研究院简介:

北京大学计算机科学技术研究所研究员,Email:wanxiaojun@pku.edu.cn

个人主页:点击此处进入

研究方向:自然语言处理、文本挖掘、人工智能。

(本文信息来源:北京大学网站;由e科网整理编辑

如若转载,请注明e科网。

如果你有好文章想发表or科研成果想展示推广,可以联系我们或免费注册拥有自己的主页

  • 北京大学
  • 人工智能
  • 机器人
  • 自然语言处理
分享到
文章评论(0)
登陆后参加评论
作者 金陵

本科生

北京大学

活跃作者
  • 爱因斯坦 科研工作者 北京航空航天大学 博士
  • 金陵 本科生 北京大学 本科
  • 梅西 本科生 北京工业大学 本科


发布成功!

确 定 关 闭