新浪科技讯北京时间3月9日消息,在旧金山GCNC(Google Cloud Next Conference)大会上,谷歌推出一个新的机器学习API,名叫“Cloud Video Intelligence”。有了这个API,开发者可以开发能在视频内部侦测目标的应用程序,让视频变成可以搜索、可以发现的视频。比如我们可以用动词、名词代表这些目标对象,例如“跑”“狗”,然后进行搜索。

  API相当于服务与应用的桥梁。新API连接到“谷歌云机器学习”(oogle Cloud Machine Learning)平台,这个平台主要用来计算;同时API又将带注释的视频存储到“谷歌云存储”(Google Cloud Storage)。用谷歌新API开发的应用程序可以获得一些特殊功能,让终端用户在视频内搜索目标变得更加容易。

  谷歌介绍称,用户现在可以在视频文件中搜索每一个瞬间,可以查找事件,探寻意义;新技术还可以帮助用户在视频中确定名词实体,搞清它们何时出现在视频中。不只如此,新技术还可以检索视频、照片、每一帧之中的相关信息,将信号与噪音分离。

  在演示样本中,用户在MP4视频文件中搜索动物,文件时长约为1.5分钟。“Cloud Video Intelligence”会生成标签,比如动物、野生动物、动物园、陆生动物、自然、旅游、旅游景点等标签。演示视频展示的是电影《疯狂动物城》中出现的洛杉矶动物园。

  新API可以侦测视频场景。例如,在同样的演示视频中,Cloud Video Intelligence发现场景变化了48次,它可以实时侦测,当场景变化时为目标物贴上标签。又例如,有一幕场景显示的是狐狸Nick,API生成了7种标签。还有一幕场景对准动物园的标志,系统生成了2种标签。请注意,这些标签都是实时生成的。

  谷歌开发了一套工具,用户可以利用工具在视频中搜索目标,正如在文档中搜索一样。

  “一直以来,谷歌就在与全球大型媒体公司合作,帮助它们从结构化数据(比如视频)挖掘价值。”谷歌云AI、机器学习首席科学家李飞飞(Fei-Fei Li)在博客中表示,“这个API面向大型媒体机构、消费科技公司,它们可以创建自己的媒体库,寻找更简单的方法管理众包内容。”(云外)