腾讯的写稿机器人Dreamwriter在深圳的未来报亭写新闻,并送给用户一份“未来报纸”。CFP供图

  记者 甘雄

  可能你无意中听说过机器人开始新闻写作的消息,可能你不认为这跟你有啥关系。

  Dreamwriter,腾讯AI撰稿机器人,腾讯“平台与内容事业群”的一个内部代号。项目组向记者证实,目前Dreamwriter年均新闻写作实际发稿量已超过50万篇、8000万字。以2018年11月15日为例,机器人共写作天气新闻1298篇、财经773篇、汽车546篇、房产126篇、体育76篇。

  记者随机在腾讯新闻APP、天天快报APP以及腾讯新闻网,输入“Dreamwriter”搜索,都会发现以Dreamwriter为作者的新闻随时都在更新,绝大部分是天气、体育和财经股市稿。1月2日下午,党中央国务院正式批复雄安新区总体规划,Dreamwriter一条“雄安新区总体规划获批复,空港股份强势封涨停”的稿件几分钟后就出炉了,一度上了腾讯新闻的推荐频道。

  写稿

  只是小菜一碟

  腾讯的机器人写作系统Dreamwriter第一次亮相是在2015年9月,其处女作是《8月CPI同比上涨2.0%,创12个月新高》。

  Dreamwriter再火一把,是2017年11月16日的“2017腾讯媒体+峰会”上,腾讯公司副总裁陈菊红在峰会上发布了企鹅智酷《2017中国新媒体趋势报告》,Dreamwriter现场写作,用时不到1秒,它还能自动配图和自动剪辑视频片段。据当时的现场观众表示:嘉宾刚说完谢谢,稿子就已经发出来了。

  当然,考验机器写作系统的时候是里约奥运和2018年的俄罗斯世界杯。据项目负责人刘康介绍,在奥运会期间,Dreamwriter产出内容达3600余篇,其中第一块金牌的新闻就是机器人写的。

  才思敏捷的Dreamwriter之所以能够写出快、准、靓的文章,都依赖于它默默收集的大数据。通过庞大的数据库,它不仅能够获取到选手的背景资料,还能根据选手在职业生涯的能力起落进行语言输出的准确把控。机器人在写作过程中会全面考虑选手的过往成果、社会声誉以及比赛中的运动细节后,才“动笔”写稿。

  除了腾讯的智能写稿系统,在俄罗斯世界杯上,由新华智云自主研发的国内首个媒体人工智能平台“Magic”也首次亮相。据新华社公布的数据显示,从6月14日俄罗斯世界杯开赛至6月20日11时,通过“Magic”平台生产的世界杯短视频达到10296条,占主要视频网站世界杯中文短视频总产量的78%。其中,最快的一条短视频《进球了!秘鲁VS丹麦》生产仅耗时16秒,在丹麦队进球后16秒内,“Magic”就自动合成了一条视频。

  编辑

  已是得力助手

  其实,写新闻稿只是Dreamwriter最早开发的功能。项目开发人员告诉深圳商报记者,Dreamwriter的机器写作最早投入实际应用,已经相对成熟的一套系统主要针对财经、体育、汽车、房产、天气等事实性报道领域,因为这些报道需要很强的时效性,同时又有清晰的文章逻辑结构特性。目前Dreamwriter写作能力已经有极大提升,在事实性报道方面已经非常接近人工写作。也有观察者认为,机器写作包括Dreamwriter在内,目前还没有突破价值判断和趋势预测两大瓶颈。

  除了文本写作,Dreamwriter还是一整个“算法辅助内容生产与运营”项目,具体包括机器写作、文本加工(纠错、摘要、脉络等)、图像处理(识图、配图、修图)、视频制作等几个类目。Dreamwriter可以为内容产品形态的创新提供有力的技术支撑。

  Dreamwriter还有一套纠错系统,用以保证内容的准确度。现在,这套算法还在不断地学习进化。在信息爆炸的今天,新闻的更新速度异常迅速,“神马”“菊外人”“skr”等新名词层出不穷,算法也可以通过语料的积累,快速实现对这类热门新词的覆盖。这套技术目前已在腾讯新闻图文、视频以及企鹅媒体平台全量使用。

  简单地说,就是腾讯这套系统除了会写稿、会配图,还会编辑配视频、排版,甚至还会改记者的稿……当然,目前限于校对。

  未来

  主要干累活

  那么,问题来了——写稿机器人采写编全流程都会了,它会代替记者吗?

  对于记者与自动化之间的关系,最早引入机器写作的美联社执行主编Ferrara接受媒体采访时这样认为,引入机器人新闻的目的是减轻记者的负担,而绝非要用技术来完全取代记者的工作:“我们还是需要记者来报道商业新闻的。我们主要是使用机器人来撰写跟数据分析相关的商业新闻。我不能让我手下大批的记者浪费那么多时间在数据分析上,我需要他们去做报道。”

  对于Dreamwriter的开发初衷,刘康也这样认为,项目诞生时要解决的最核心的问题就是“财经新闻的生产能力满足不了内容的需要”。据统计,中国的金融市场平均每天发布大约1900篇公告,而这1900篇公告,一位资深证券编辑需要100个小时才能看完。Dreamwriter的意义便是解放了一大部分记者编辑的人力:“远远谈不上取代(记者),我希望它始终是个助手,帮我整理资料,然后我来赋予它生命。”

  对于未来记者与机器之间的关系,刘康作了一番畅想:“很有可能未来每个编辑都会配一个人工智能写稿软件,以帮助人来抓取热点信息或解决掉繁琐、重复、无创造力的工作,把人放在更高层级的工作上,让机器帮助人提高工作效率。”