导读 | 在 Facebook 和其他社交媒体平台上最常见的分享内容之一是照片。虽然大多数社交媒体用户都能看懂一张图片,并了解它所代表的内容,但对于那些盲人或视障人士来说就不那么容易了。Facebook 表示,屏幕阅读器可以使用合成语音描述这些图片的内容,让盲人或视障用户能够理解 Facebook feed 中的图片。 |
然而,许多照片在发布时没有 alt 文字,导致 Facebook 在 2016 年推出了自动替代文本(AAT)。该技术利用对象识别技术为盲人或视障用户按需生成照片的描述。自 2016 年以来,Facebook 一直致力于改进 AAT,并在最近推出了下一代技术。Facebook 在 AAT 上的进步改善了用户的照片体验,AAT 可以可靠地检测和识别照片中的概念数量扩大了十倍以上。这意味着没有描述的照片减少了,提供的描述也更加详细。AAT 可以识别活动、地标、动物类型等等。
AAT 现在会给出这样的描述:"可能是两个人的自拍,户外,比萨斜塔"。Facebook 还表示,能够在照片中加入有关元素的潜在位置和相对大小的信息是行业首创。它不是简单地描述 "可能是五人的合影",而是描述成“两个人在照片的中心,另外三个人向边缘分散。”
Facebook 表示,这一进步可以帮助盲人或视力受损的用户更好地理解家人和朋友发布照片中的内容。最新版本的 AAT 使用了一个在数十亿张 Instagram 公开图片和标签数据上训练出来的模型。训练后产生的模型更加准确,并且在文化和人口统计方面更具包容性。改进后的 AAT 可以可靠地识别 1200 多个概念。
原文来自:
本文地址://gulass.cn/facebook-uses-ai.html编辑:王浩,审核员:清蒸github
Linux大全:
Linux系统大全: