Facebook利用人工智能技术自动将信息流的图片生成新闻标题,该工具名字为“Automatic Alternative Text”(自动文本转换器)。该工具与“文本转换语音”引擎相结合,可以让盲人正常使用Facebook。
该技术使用深度神经网络,可以自动识别新闻图片中的特定对象,比如汽车、小船、冰激凌或者披萨,还能识别图片中人的特征,比如是否微笑、有没有胡子、是否带眼镜,除此以外还能识别出图片的一些特定含义,比如里面的太阳、海浪或者雪花。生成新闻文字标题后,再使用“文本转换语音”引擎就能自动语音读出图片新闻。
该技术是由Facebook的一名盲人员工Matt King开发的,他去年首次向记者展示产品原型。如今集成了Facebook人工智能技术,识别图片的能力大幅提升。Matt King表示系统并不能100%正确识别,并且还不能通顺地连成一个句子,只是一些识别出来的单词堆砌,比如一张户外树林的照片,系统识别出:tree,sky,outdoor(树、天空、户外),还不能连贯成:蓝色的天空下,有一片树林。
|