吉联睿观点 > 社群内容审核干货!以及分享23个社群审核中容易疏漏的点

社群内容审核干货!以及分享23个社群审核中容易疏漏的点

发布日期:2024-02-28 22:42:07 浏览次数:919

什么是社群内容审核?


社群内容审核就是审核你的平台上用户生成的任何内容(UGC)。如果是Yelp,那就意味着审核用户的评分和评论;如果是Facebook,则意味着要审核用户可能在网站上发布的任何内容。


哪些类型的网站、电商或者社群社区可能会得益于内容审核人员?


所有的UGC网站!任何UGC网站都必须时刻对用户体验保持一定的敏感度,电商和社区通过内容审核来培养用户的信任度,并为用户之间的交流建立一个安全的空间。


有哪些社群内容审核是主动的,有哪些是被动的?


大多数公司都缺少相关的基础设施和工具来主动审核侮辱性内容。这是因为这些公司在搭建UGC平台时不会在内容审核系统上投入太大的成本。


像Facebook、Yelp和Google这样的大公司采取了两种更主动的方式:第一种方法是使用机器学习,并让用户能够标记有问题的内容。第二种方法仍然是被动的,因为它依赖于用户上报侮辱性内容,但它更积极主动,因为内容管理系统可以利用上报的内容在未来剔除类似的内容。


反欺诈和风险团队如何将社群内容审核纳入到公司战略中,以提升公司的品牌和安全性?


允许UGC的公司必须要在产品级上具备内容审核的能力:在技术路线图中增加审核功能,或者允许用户标记不适当的内容。


例如,Facebook在曾经很长的一段时间内都不允许用户标记有问题的内容,他们的用户是一个巨大但尚未被开发的内容审核源。事实上,内容审核不一定来自内部团队,它也可以是外部团队。如果社区中的任何人被允许发布内容,那么任何人都应该能够上报不适当的内容。


如果团队在一开始的时候没有把内容审核考虑进去,那么到后面就一定会遇到各种问题。从你业务发展的初期就考虑内容审核,并思考如何使用机器学习系统进行自动化审核,这是非常重要。如果你提前将内容审核纳入到公司战略中,那你就可以更好地扩大业务运营。


社群内容审核人员必须小心谨慎:要清除彻底,但又不能误杀。在遇到有争议的内容时,内容审核人员在保证工作效率的基础上是如何处理的呢?


如果你跟内容审核人员交流过,那么你可能会发现,要清楚彻底,又不能误杀是非常困难的!这个问题在很大程度上来自于审核人员本身存在的倾向。假设某人在网站上发布了一个提问的帖子。现在许多网站都可以利用第三方信息来了解这个用户的很多信息,这些信息可能表明该用户是一个十分令人讨厌的人。一旦内容审核人员知道了用户的背景,他们就可能会去推断用户的意图,让自己带着有色眼镜去审核这个用户的帖子。


对于内容审核人员来说,根据制定的政策和程序进行判断可能非常困难。他们必须专注于服务条款,并将他们对用户的主观感受与现有的规则区分开来。


社群内容审核中可能出现哪些灰色案例?


假设你的平台不允许发表仇恨性言论。问题是仇恨性言论有几种不同的判断标准。在推特上,你不能针对某个特定的种族或宗教。但这个问题很快就会变得模糊起来:虽然你可能可以说“我讨厌美国人”,但你是否可以说“我讨厌白人”呢?恐怕是不行的。


一般来说,公司不允许用户对受保护的东西发表恶意观点。但是,受保护的东西可能因公司而异。大多数企业通过在表达观点和威胁行动之间画一条线来处理灰色地带。例如,“我讨厌凯文的发型”这句话与“每一个有着像凯文一样发型的人都欠揍”有着很大的区别。尽管两句话都对他的发型持否定态度,但第二句话崇尚暴力。


但是,许多在线社区都有自己的暗语。例如,Twitter不允许你对犹太人做出仇恨性评论,但社区可以开始使用暗语来指代犹太人,以绕过这些政策。


在线社区或电商网站上,社群内容审核人员该如何制定明确的指导政策来确定哪些内容可以接受,哪些不可接受?


制定指导政策最简单和最有效的方法是提出哪些内容可以接受,哪些不可以接受的具体例子。虽然理论性的指导政策很重要,但这些政策的实际应用同样至关重要。当你需要扩充内容审核人员和训练模型的时候,这一点尤其重要。


手动社群内容审核有哪些限制和缺点?


有三个主要的限制,分别是规模、灵活性和响应时间。规模:随着平台的发展,雇用和培训人员的速度很难跟上平台发展的步伐。灵活性:举个例子,如果你想把业务拓展到保加利亚,那么你必须快速找到可以用保加利亚语审核内容的人员。响应时间:网站上的内容可以在一天中的任何时间发布,这意味着审核人员必须二十四小时不间断地工作,尽管他们已经很疲劳了。机器学习可以解决这三个限制。


其中,规模是最重要的。侮辱性的内容是活的,它可以被截图并共享,甚至可能会进入新闻界,这会严重损害公司的形象和利润。即使你拥有一个强大的内容审核团队,他们快速响应这些内容的能力也是有限的,他们也很难无偏见的进行审核。这正是机器学习充分发挥作用的时候,它没有这样那样的限制,它会随着业务的发展而发展。


社群内容审核机制:


① 先审后发:


用户上传的内容并不直接显示在线上,外部用户不可见,而是先存在系统服务器中,由机器进行既定的逻辑判断和内容运营人员在后台查看之后,符合平台规则才能发布。


优点:解决了低质量信息泛滥的问题,能有效避免违法/广告信息、低质量内容损害产品的调性。


缺点:降低了信息的流动性和时效性,且给内容运营人员带来的工作量比较大。


② 先发后审:


一种事后处理方式,即优先保证信息流通与时效性,先让内容发布在线上,再去审核是否符合规则。


③ 内容处理方案:


审核成功:发布成功,精华,推荐,话题转移至对应圈子,加*处理;


审核失败:删除,沉帖,前端提示禁止发布,内容复原(最近一次内容覆盖本次修改内容);


账号处理:冻结,解冻;


社群内容审核逻辑*流程图:

1111.jpg




· 项目数据:


①业务数据:


【总数/日/各维度/占比】内容总数、审核成功数、审核失败数、待审核数、转移话题数、删除话题数、沉帖数、推荐数、加精数、冻结账号数、达人话题数、非达人话题数;


【总数/日/各维度/占比】新/高危/达人/普通用户内容总数/违规内容数/审核成功数/总内容数/封号数;


②工作报表:


姓名/处理内容总数/审核成功数/推荐数/加精数/审核失败数/沉帖数/删帖数/冻结账号数/处理内容数占总处理数据占比;


23个社群审核中容易疏漏的点:


在内容审核中,总有一些疏忽,犯下无心之过,导致内容安全问题。就此,成都吉联睿审核团队分享了日常审核中最容易疏漏的点,希望能帮到大家:


1,图片中与背景色相似的水印(微信、联系方式等),未察觉;,


2,相同的刷屏内容,未处理干净;


3,垃圾信息分拆多条发送,单条无问题;


4,短链、外链跳转后违规;,


5,OCR违规,图片旋转等;


6,涉政、违禁的网络用语或者黑话(419、上车等);


7,政治人物被查后,全信息扫描;


8,隐晦的推广行为(非明确的联系方式、广告词);


9,藏头诗、藏尾诗包含违规内容


10,没有多维度拦截拦截监控有害信息,昵称、头像、评论或者注册行为IP、设备ID、手机号等


11,成人番号判断;


12,小语种有害信息;


13,特定圈子的特定名词(耽美、BL、SM、幼齿、慕残等);


14,多图组合违规;


15,联系方式变形(阿拉伯、字母、繁体字);


16,盖楼形式的违规字符图;


17,直播中不经意拍摄到违规内容;


18,旗帜、地图、产地等易被疏忽的细节;


19,干扰词、变形词易漏;


20,通过内容引导到其他平台,从其他平台进行违规行为;


21,头像有问题处理后,该用户的昵称及其他UGC内容被遗漏,没有全方位处理;


22,未紧跟监管规则,被监管部门打时间差,比如英烈保护法发布后查出暴走漫画;


23,影射、暗喻等图片或文字,易漏过。