Facebook以AI作为审核工具,提升仇恨语言处理效率389%!

脸书使用AI作为审核工具,提升了针对仇恨语言处理的效率达389%!

脸书亚太区内容政策经理瑪努(图片来源:Inside) 

脸书IG 20亿用户

社交媒体平台上的仇恨言论一直都是很难处理的问题,随着特定的社会事件发生,比如选举,会导致此问题更严重。脸书(Facebook)亚太区内容政策经理瑪努(Manu Gummi)6月3日说,脸书和Instagram合共超过20亿用户,来自不同语言和文化,为了让大家更加自由和安全的表达意见,制定了目前的内部审查系统。

(图片来源:Martech

内容规范5大核心

脸书社群规范包含了5大核心:意见,真实性,安全,隐私,尊严。

由于发表“意见”是自由人权的一部分,网络往往带来滥用的机会,为了确保用户有表达的自由,意见的安全性非常重要。“真实性”方面,为了让用户在平台上负责,确保用户的真实性,不能用假冒的身份。“安全”方面,不允许威胁,恐吓,伤害他人的言语或行为出现。“隐私”,确定用户身份,但又保有隐私。“尊严”,社群上人人平等,用户必须尊重自己也尊重他人,遵守社群规范。

(图片来源:inc.com)

每两周进行一次政策论坛

脸书内容政策制定小组每两星期都会举行一次“政策论坛”(Policy Forum),让多方面专家探讨当前的规范。之后,小组会针对内容咨询相关人员,内部外部相关利益者,之后再进行讨论,再做出决定,是否放入政策中实行。

关于仇恨的定义,是脸书面对的一大挑战,因为没有任何规范定义仇恨的言论。每个人对言论的容忍程度也不一样。仇恨言论也不能只是看一字一句,还要考虑到发言者和接收者的语境和脉络。仇恨言论是动态的,会随着时间过去而更变含义,因此很难掌握其变动性。

(图片来源:newsfeed

仇恨言论的要素和等级

无论如何,脸书还是归类了仇恨言论的要素:1.有攻击行为,包含暴力,刻板印象,贬低他人等。2.攻击对象的“受保护特征”,包括种族,国籍,宗教等。

仇恨言论的严重性程度方面,脸书也列出了三个等级:
第一级,最严重,包含语言暴力,冥灭人性言论,嘲弄仇恨罪的概念,比如将非裔明星和猴子后制融合等行为。
第二级,诋毁他人的陈述,轻视,憎恨,厌恶,咒骂等。
第三级,号召排挤或隔离某方面,诋毁或毁谤。

(图片来源:Wikimedia

AI审核提高效率

脸书自2017年开始执行内容审查,2018年使用AI人工智能作为辅助工具,脸书这几年一直在科技上进行投资,提高审核效率,也不断增加更多远的内容,保障用户的安全。

根据脸书社群守则执行报告显示,2019年12月-2020年12月间,脸书针对仇恨语言的处理效率增加了389%,AI科技主动侦测移除的仇恨言论比例为97.1%,比2017年的25%有明显进步。

(图片来源:台湾醒报

35,000审核人员

首先,AI会不断主动侦测内容,依照仇恨言论分等级,再交给人类审核,目前脸书负责审核的人员高达35,000人,其中15,000人全天候进行人工分析。用户也可以主动检举不当言论,脸书保证会在24小时内完成审核。
为了能够提高AI辨识内容能力和精准度,脸书团队致力提升多语言理解,完整贴文理解,和排序预先秩序的功能。除了平台的内容审核,用户也可以自己管理脸书上的隐私和动态设定,从而减低看到不当内容的机会。

文章资料来源:Inside