大洋网讯 全球人工智能的发展日新月异,AI+工业、AI+医疗、AI+制造业、AI+教育……可谓百花齐放,随着互联网的不断演进,移动智能终端的高度成熟,信息“爆炸”时代已悄然来到大众身边,在这个海量信息的背后,衍生了一种新的“媒体人”,它们不是人类,而是“机器人”。
今年10月,广州国际人工智能产业研究院正式入驻广州市南沙区,研究院携16支人工智能领域高端人才团队率先进驻南沙。重点实验室中,有一支专注于人工智能和自然语言处理(NLP)在资讯内容领域应用的AI研发团队——云天弈,也就是大家早有耳闻的“写稿机器人”。
智能机器人除了能下围棋,还能写稿?早在2009年,美国棒球大联盟就首次启用了智能机器人StatsMonkey完成了比赛稿件的撰写,而2015年,国内互联网企业上线了写稿机器人DreamWriter,截至目前该系统已运作近三年时间。人工智能已慢慢融入当下的内容创作,“写稿机器人”的“智商”究竟有多高?人工智能又能为媒体行业带来怎样的变化?
未来,随着物联网技术的深入发展,在万物互联的大背景下,这一领域的专家更对全媒体记者描绘了一个更“科幻”的场景。
智能写稿机器人数量不断壮大
说起智能写稿机器人,最早要追溯到2009年,美国棒球大联盟首次用智能机器人StatsMonkey通过统计分析,识别比赛期间的重大事件并总结整体比赛动态,自动编写了一篇体育报道。
而到了2015年,“写稿机器人”才在行业中真正爆发,国内外各大媒体开始“试水”写稿机器人。据了解,在国外,《纽约时报》利用Blossomblot系统筛选文章向社交网站等平台推送;《洛杉矶时报》智能系统专注处理地震等突发新闻……在国内,2015年名叫Dreamwriter的写稿机器人正式上线,发布了一篇名为《8月CPI涨2%创12个月新高》的报道。随后,国内媒体也陆续“尝鲜”,新华社推出机器人写稿项目、阿里巴巴联合第一财经推出“DT稿王”,今日头条推出了“xiaomingbot”……在内容生产领域,传统媒体、移动互联网媒体纷纷跟进这股技术热潮,试图将写稿机器人引用到日益大量的新闻报道、内容生产以及分发的过程中;在技术领域,人工智能业界越来越多的研究团队投入到“写稿机器人”的研发当中。
揭秘写稿机器人
那么,“写稿机器人”是如何“写”出一篇稿件的?国内AI新闻实验室云天弈CEO金利杰博士在接受记者采访时表示,“写稿机器人”只是让外界更容易理解的称呼,在业内他们更愿意将这类人工智能系统称为“智能辅助创作系统”,这也是更为贴切的说法。
以“小弈写作”平台为例,它从海量资讯中迅速提炼内容线索,根据用户输入的关键词,一键生成文章框架,并从多个维度自动评判内容价值。用户可以通过“系统热门话题”列表搜寻当前最热的新闻话题,一键生成相关主题文章;也可以通过输入关键词,让“小弈”写一篇命题作文。
全媒体记者了解到,“写稿机器人”与传统新闻采写的模式不同。“写稿机器人”每天自动“抓取”各类海量信息,当记者和编辑需要某个新闻内容时,输入关键词,系统会根据关键词先“抓取”上万条来自各种渠道的相关信息,并生成初稿。在“小弈写作”平台上,国际资讯方面的活跃数据横跨两年,整体更是存储了大概5~6年的资讯,这也侧面反映了写稿机器人平台背后拥有的海量数据。事实上,这也是作为人工智能平台的必备条件——只有拥有足够大的数据储备,机器人才能进行分类和学习,从而构建事件的知识图谱。
当然,不同的人工智能平台有不同的算法与思路,像云天弈的AI系统并非完全依靠机器人写出一篇完整的稿件,“绝大部分稿件都是由编辑进行后期加工和润色”。
“机器人”主要集中在体育、财经类新闻报道
腾讯媒体研究院发布的研究内容指出,“写稿机器人”总共可分为三类,都依赖自然语言处理技术。第一类是基于模板的写作,即使用一个文章模板,将数据库中的结构化信息(包括具体数字、百分比等)填充进去。第二类是提取后整理,即对包含无用信息的长自然语言文本进行分析,提取文章中的关键信息,重新组织语言后输出。第三类是完全依靠机器自动生成,一般是通过训练语言模型,对语言进行数学建模,然后不使用原始文本,而是通过人工智能的方式逐句地生成算法认为“最能够体现原文含义而且看起来像一句话”的文字。
据了解,当下众多的写稿机器人,或者说大部分“智能辅助创作系统”都以第一类模板写作和提取后整理为主。其较为专注和擅长的写作领域主要是体育类、财经类和灾难类新闻。这几类新闻的共性在于,其内容大部分都依靠数据“说话”。以NBA赛事新闻为例,大部分构成是比分+队员的得分表现,也就是数据分析为主的新闻类型。因此,在“机器人”的数据库里会有这类新闻的模板。同时,系统通过人工智能具备的深度学习能力,在撰写这类新闻的同时,分析记者/编辑是如何处理的,从而得到更大量的数据,建立更多种多样的模式。
全媒体记者留意到,腾讯Dreamwriter所撰写的财经类新闻,大部分都是关于某只股票股价升跌的即时新闻。据Dreamwriter负责人刘康表示,Dreamwriter最初诞生时要解决的最核心的问题是“财经新闻的生产能力满足不了内容的需求”。
而云天弈的“小弈写作”是基于广泛题材的智能资讯写作系统,是第二类和第三类的结合,其写作范围不局限于靠数据“说话”的新闻领域。据测算,一个小型的编辑团队,在“小弈写作”智能创作平台的帮助下,工作效率可以提升五倍,“传统记者/编辑一天大概可以写两篇长篇幅的新闻,而在‘小弈写作’的配合下,一天可完成十篇左右”。在整个智能辅助创作过程中,系统不但能帮助选题,还能“生成”与记者/编辑想写内容的相关度极高的文章框架,可大幅简化写作流程,缩短成稿时间。
今年1月,机器人“小弈”在GET资讯App“上岗”。一般而言,传统新闻资讯的写作,编辑的工作量占80%,机器占20%。目前GET资讯团队可以做到机器完成65%,人工完成35%的程度,未来希望能实现机器完成80%,编辑只负责20%。“在我们看来,能完全由机器生产并自动发布的内容只占很少部分,因为任何媒体都需要监管和内容审核。未来,新闻资讯平台的人力也将主要集中在这部分。然而,降低人力成本、提高时效性也是必然的,例如以往30人团队完成的工作,现在由10人或更少人的团队也能完成。”金利杰表示。
据国内大型内容资讯平台的阅读量数据统计,在“小弈写作”的帮助下,GET资讯撰写的不少新闻的阅读量能达到几万到十几万,有的甚至上百万。
经过训练能有效提升“机器”的内容生成能力
众多互联网企业、科技研发团队聚焦写稿机器人,与近三年来移动端新闻资讯平台领域蓬勃发展无不有着关系——众多新闻内容客户端的出现,意味着每天需要产出海量的新闻内容资讯,且保持着按分钟计算的更新速度。另一方面,则是互联网用户对新闻、新资讯的渴求,如今坐地铁、坐公交上下班的路上,大家都会在“刷”手机,对内容资讯的需求量更是几何级数地增加。值得留意是,去年,企鹅智库对外发布了《未来地图:2017年中国新媒体趋势报告》,报告显示,我国网民平均每天花在阅读新闻资讯上的时长大约为67分钟,其中日均超过两个小时的“重度用户”占比达到了14.6%。
如今,国内大型的内容资讯分发平台都讲究“千人千面”——通过大数据、算法、标签等方式,让每个人看到的内容都不尽相同。同样,“写稿机器人”也能通过后台的大数据、机器学习能力,针对每个人进行不同的内容推送。云天弈如此比喻:“想象一下,写稿机器人就像渔夫,每天都会’打鱼’,它将打回来的鱼、虾、蟹等,通过人工智能算法进行分类组合。”由于每个人进入智能平台的“入口”不同,需求和撰写的内容亦不同,因此平台能“知道”他需要什么内容、哪方面内容的需求较多。此外,机器为读者提供的内容是24小时不间断更新的。
“人工智能驱动的智能辅助写作系统和自动写作系统经过海量优质内容的训练,一天能够生产成百上千篇资讯文章,将大力提升资讯内容的生产效率和时效性。人工智能技术在传统资讯内容生命周期运作的部分环节实现了革新。”云天弈方面如此表示。
讨论:
写稿机器人能代替人类工作?
业界认为更多是辅助功能
在写稿机器人上线之初,“机器人来抢记者饭碗了”“记者们要哭晕”……一时间引起了科技、媒体业界的高度关注。近几年来,写稿机器人会否代替人类成为“新闻报道者”,也一直伴随着技术的发展愈发激烈。
广东财经大学人文与传播学院院长、新闻学博士马持节表示,先进的技术包括当下的智能机器人,只是助写手段,工具价值极强。“工欲善其事,必先利其器”,新闻传播行业不会消失,只会搭乘先进技术快车,行稳致远。然而,新闻行业依靠的,必然是善于利用先进技术的媒体工作者,而非技术本身。智能机器人因为与大数据、云计算、AR/VR等前沿技术高度融合,因此具备了极强的数据采集、提取、运算和信息自组织能力,有助于媒体工作者提高内容生产效率,但同时也强化了媒体竞争。
谈到“写稿机器人”的优势与劣势时,他认为,与人相比,智能机器人内容加工生产的优势比较明显,数据量大、信息点多、生产速度快、计算化生产服务精准、可突破时间、空间的束缚。然而,不足也是非常明显,例如从数据出发、纯客观视角、“目中无人”、在议程设置、新闻评论、舆论引导等信息增值方面缺少自如可控的能力。
写稿机器人亦不可能成为未来媒体的一个分支。人类一直走在利用新技术提高内容生产效率的路上,当下,前沿技术就是智能机器人,于是智能机器人被媒体化预设,也是情有可原的,但智能机器人永远只能用“它”来指称,因为是机器,是智能技术而已,永远不能成为媒体,而媒体的核心是主观能动性极强的人。
金利杰博士坦言,研发的初衷是希望利用智能辅助创作系统,将记者、编辑从新闻报道的一些枯燥、辛苦而重复的工作中解放出来,聚焦于内容创作的核心。
马持节博士亦强调,新闻工作者的失业不是因为技术的进步,而是行业与时俱进导致的新闻工作者群体自我淘汰的结果,部分不适应变化了的时代要求的记者、编辑,必然不适应变化了的新闻传播行业,因此,失业者必然会存在。
相关链接:
猝不及防我国首个AI主播“上岗”
在刚刚举行的乌镇世界互联网大会上,我国互联网企业搜狗与新华社一同推出了全球首个“AI合成主播”。据了解,虚拟主播是以新华社某主持人为原型,不但能够模仿人的声音,还能够模仿人的表情。
据悉,AI合成主播能够实现高效的新闻播报。用户只需要输入新闻文本,它就能够用和真人一样的声音进行播报,并且连唇形、面部表情也与真实的主持人相吻合。
具体操作是由真人主播面对镜头录制一段播报新闻的视频,“搜狗分身”凭借这段视频可以将真人主播的声音、唇动、表情动作等特征进行提取,然后通过语音合成、唇形合成、表情合成以及深度学习等技术,“克隆”出与真人主播十分相似的具备新闻播报能力的AI虚拟主播。
据搜狗表示,“搜狗分身”利用旗下的AI能力,从图像表情、声音语言习惯、逻辑思维等层面对AI进行拟人化训练,然后“克隆”出人类的AI分身,进而帮助人类提高信息表达和传递的效率。
文、图表/广报全媒体记者文静(署名除外)
图@视觉中国