APP推广合作
联系“鸟哥笔记小乔”
内容审核逻辑:从入门到被门槛绊倒!
2020-05-13 15:46:09

读完这篇文章,你可以详细了解文字类内容审核的逻辑,还会了解一些图片和短视频审核的技术,足以补充一个运营或产品在这方面的知识储备了。来看看~

文章开始之前,给大家两条建议:

  1. 除非你别无选择,尽可能不要从事纯粹内容审核岗位

  2. 如果你的工作和运营或产品有关,都需要了解内容审核的逻辑

“儿童送养”这个话题在大多平台都是极为罕见的,但知乎最近就因此爆发了一场危及平台声誉的危机。

内容审核逻辑|从入门到被门槛绊倒

内容审核就是这样一种职业,违法违规信息覆盖范围极广,新的违规信息层出不穷。无论你多么有经验、无论审核系统多么先进,只要发生问题,看起来都是很基础甚至很愚蠢的问题。

知乎这样一个有很强的技术实力和内容审核经验的平台,也会在这个问题上摔跟头。并且可以预料的是,不知道在多久的以后,知乎一定还会发生一次又一次因为存在违规内容带来的危机事件,这事情无可避免。有人说,对于内容审核人员来说这是从入门到被门槛绊倒,一点都不夸张。

读完这篇文章,你可以详细了解文字类内容审核的逻辑,还会了解一些图片和短视频审核的技术,足以补充一个运营或产品在这方面的知识储备了。

在不同公司,对审核类职位的划分标准不同,比如有内容安全审核、内容推荐审核、内容质量审核等类似职位。虽然在侧重点和具体操作上有所不同,但有许多逻辑都是共通的。为了避免文章过于复杂,我们在这里侧重最常见的内容安全审核。

一、审核模块

不管是什么内容的审核,都应该包含以下四个基础模块:机器审核、人工审核、用户投诉审核、结果复审。

内容审核逻辑|从入门到被门槛绊倒

  • 机器审核,是按照制定好的规则或机器学习算法对内容进行审核,通常,成熟的审核系统能将95%甚至99%以上的内容都自动审核并做出处理。确定有问题的会被自动删除,难以判断是否有问题的会被标注,进入人工审核程序。

  • 人工审核,虽然用户投诉审核和结果复审大多时候也是人工审核,但这里所说的人工审核,特指审核机器无法判别的内容,通常占平台内容数量的比例不超过5%,但对于一些大型的内容平台,绝对数量已经很多了。在内容爆炸的时代,我们看到许多平台在全国都有多个审核中心,每个审核中心的员工数量都成千甚至上万。

  • 用户投诉审核,是前两者的弥补,有很多违规内容以前没有出现过,所以不在规则可以过滤的范围内,或者非常隐蔽,规则难以严格过滤。用户的投诉是发现新问题的重要渠道。通过知乎的危机事件,我们更应该重视对投诉的审核,并及时据此对机器审核做出补充。

  • 结果复审,通常采取抽查方式,比如通过复审机器删除的内容,看规则或算法是否过于严格;比如通过查看人工删除和通过的内容,看员工的工作是否按要求执行;比如通过内容的整体巡查,看是否存在新的问题未被注意到。

在文字类内容平台,比如知乎、简书、豆瓣以及各类论坛网站,机器审核主要是基于关键词过滤的逻辑,逻辑比较简单,但也没有想象的那么简单。

二、关键词过滤

一篇文章发布到平台后,需要至少经历以下环节:

内容审核逻辑|从入门到被门槛绊倒

词语过滤的环节,关键词主要分为三类:

内容审核逻辑|从入门到被门槛绊倒

禁止关键词,只要匹配到这个词,内容就被自动删除或禁止提交。通常只有极少数词会被纳入禁止关键词,比如明确的色情、邪教以及广告的专属关键词。

审核关键词,这是最常见的关键词种类,只要匹配到就会自动进入后台进行审核,文章中的关键词会被高亮并罗列出来,有助于审核人员快速判断。审核关键词也应该尽量是专属关键词,以防止太多内容被拦截到后台。

替换关键词,在许多平台,我们会在文中看到莫名的*号或字母缩写,这可能不是文章作者写的,而是这个词被系统自动替换。平台不希望出现这个关键词,但用别的代替读者通常也能读懂。比如一些政治、宗教、不文明用语类词语,都有可能被自动替换。

内容审核逻辑|从入门到被门槛绊倒

当然,管理员在添加关键词时,很多时候并不是直接把关键词添加到后台。否则用户用很简单的方式就可以避过关键词过滤,比如在关键词内加一个空格,系统就难以匹配到。

所以,一般后台都会支持限定符{x} 以限定相邻两字符间可忽略的文字,x 是忽略的字节数。在Discuz!网站后台有明确说明,如 “a{1}s{2}s”(不含引号) 可以过滤 “ass”也可过滤 “axsxs”和 “axsxxs”等等。对于中文字符,若使用 GBK、Big-5 版本,每个中文字符相当于 2 个字节;若使用 UTF-8 版本,每个中文字符相当于 3 个字节。

另外,关键词还可以支持正则表达式,来匹配具有一定模式的关键词,比如”/1d{10}([^d]+|$)/“(不包括引号)用来匹配手机号码。正则表达式的内容过多,大家有兴趣可以搜索学习一下。

三、技术概览

以上讲述的,主要是文字类内容的审核和规则,逻辑简单,但应用最为广泛。近年随着短视频类产品的兴起,内容审核的逻辑需要更加深层的技术支持。

技术上的东西,对大多人来说如同天书,而且也没有必要深入了解。我们挑选几个容易理解的点,来窥探几分内容审核背后的技术。

内容审核逻辑|从入门到被门槛绊倒

来源:某相关产品宣传网页


OCR(文本识别技术),主要用来识别图片中存在的文字。许多违规内容,包括联系方式、色情信息、广告信息等为了规避审核,都会以图片的方式呈现。

人脸识别技术,通常用来识别政治、宗教类人物,识别到后可以直接删除或者进行风险标记。

语音识别技术,语音识别的应用场景比较多,但在内容审核领域仍然不是刚需,所以使用的较少。但也有些直播或音频平台比较重视音频对比、声纹识别技术,可以轻易识别到一些固定模式的违法违规声音。

视频识别≈图片识别,视频是画面与音频组成的以帧为单位的画面,通常采取截帧上传与服务器数据对比来识别。审核模式和图片审核相同,比如通过画面皮肤裸露状态来判断是否过于性感、是否是色情内容。

上下文语义识别技术,这种技术用来判断一句话是否能跟上下文结合,是否是一段垃圾文本。比如说,在评论区随便输入一串奇怪的文本,如果系统认为和上下文不相关,就有理由将内容放入审核区。

技术是很酷,用好了可以大量减少我们的工作,但内容审核技术的实施是一件很难一劳永逸的事情,其中的尺度和参数都需要人来不断维护,而且人工审核仍然是非常有必要的,并且需要的人工可能越来越多。内容审核技术的应用,仍然任重道远。

四、常见问题

1. 替代关键词不能太简单

我曾经在一款APP上看管理类文章,整篇文章多处说到给员工定绩效要遵循“**ART原则”,我迟疑了好几秒才明白,原来是“SMART原则”。

SM这个词只有两个字母,无论是作为禁止、审核还是替换关键词都不合适,都容易拦截或替换大量不应该处理的内容,一般的方法很难处理。

这时候,我们可以总结一下模式,如果sm这两个字母前面是英文字母,或者后面是英文字母,一般来说就是另一个英文单词,就不会有问题。我们就可以用正则表达式把这一规则写出来,再设置审核或替换就会好很多。

2. 审核时间与用户体验的权衡

去知乎和微博搜一下“审核”,被抱怨最多的问题就是审核时间长。用户提交内容到内容审核通过,这期间心情会剧烈波动,如果用户等了一两天时间,最后内容被莫名其妙地拒绝,而且不给任何明确的拒绝理由,用户的心情就会由期待变为焦虑,进而变成愤怒,这就是B站被up主抱怨最多的地方。

我们可以从以下角度优化用户体验:

  1. 用户提交内容后,正常呈现已发布的内容状态,可以反复编辑,只是给出状态提示,提示内容正在审核,如果有必要可以提示一般多久可以审核完。

  2. 用户提交内容后,如果进入审核,但觉得问题不大,或者用户历史记录良好,可以自动进入“限流”状态,即只允许自己和粉丝/好友观看。待审核通过后,开放给所有人。这期间不需要给用户任何提示。

  3. 用户内容被拒后,原因是可以找到依据、可以确定的。很多平台都是让用户具体原因参考某某规范文档,但这个文档里又是一堆大而化之的空话。许多时候机器审核是存在误删的可能的,这时候如果申诉渠道也不能及时反馈,就会让人非常火大。

  4. 优质账号设为信任账户或优先审核。比如官方账号、以前从没出现问题的老账号,至少应当做到优先审核,甚至直接放开,先放后审。

3. 理解内容审核的保守倾向

越是体量很大的平台,内容审核越是有保守倾向,这不只是因为盘子大了更加在意风险管理,还有一些现实的原因。内容数量太多,平台就不得不采用规则和算法去审核,这些规则和算法需要最终做出决策,就难免拿着标准一刀切,即使这把刀很小也会有误伤,这种标准对很多内容就显得过于严格。

比如皮肤裸露面积达到多少会有问题、裸露哪些位置会有问题,无论标准多么的细化,都会存在误判,被误判的内容比例可能很小,但绝对数量很大。据说很多图片和视频中如果存在加菲猫,都会被过滤掉,因为它黄色面积太大而且和人的皮肤很像。

在被审核的用户看来这些标准有点保守,有点不近人情,甚至可笑。平台的管理人员也知道问题,但他们很难做到很细致,为了快速把违规的内容剔除,只能牺牲掉一部分人的用户体验,毕竟违规内容一旦出现,对平台来说就是大问题。所以说,内容审核技术的应用还非常任重道远。

以上的内容,对于一个运营或产品工作者来说,已经足够了。但如果你真的需要对一款产品的内容审核规范负责,就需要去学习更多知识,需要有更加专业的精神和更谨慎的态度,未来还会有无数难以预料的坎坷等着你。

-END-

鸟哥笔记,行业动态,娱乐硬糖,互联网,APP运营,行业动态

阿互
分享到朋友圈
收藏
收藏
评分

综合评分:

我的评分
Xinstall 15天会员特权
Xinstall是专业的数据分析服务商,帮企业追踪渠道安装来源、裂变拉新统计、广告流量指导等,广泛应用于广告效果统计、APP地推与CPS/CPA归属统计等方面。
20羽毛
立即兑换
一书一课30天会员体验卡
领30天VIP会员,110+门职场大课,250+本精读好书免费学!助你提升职场力!
20羽毛
立即兑换
顺丰同城急送全国通用20元优惠券
顺丰同城急送是顺丰推出的平均1小时送全城的即时快送服务,专业安全,准时送达!
30羽毛
立即兑换
阿互
阿互
发表文章5
阿互,专注内容表达方式。
确认要消耗 0羽毛购买
内容审核逻辑:从入门到被门槛绊倒!吗?
考虑一下
很遗憾,羽毛不足
我知道了

我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。


一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
    1)反对宪法所确定的基本原则;
    2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
    3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
    4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
    5)煽动民族仇恨、民族歧视,破坏民族团结;
    6)破坏国家宗教政策,宣扬邪教和封建迷信;
    7)散布谣言,扰乱社会秩序,破坏社会稳定;
    8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
    9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
    10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
    11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
    12)危害未成年人身心健康的;
    13)含有法律、行政法规禁止的其他内容;


2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
    1)轻蔑:贬低、轻视他人及其劳动成果;
    2)诽谤:捏造、散布虚假事实,损害他人名誉;
    3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
    4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
    5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
    6)谩骂:以不文明的语言对他人进行负面评价;
    7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
    8)威胁:许诺以不良的后果来迫使他人服从自己的意志;


3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
    1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
    2)单个帐号多次发布包含垃圾广告的内容;
    3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
    4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
    5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
    6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
    7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
    8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。


4. 色情低俗信息,主要表现为:
    1)包含自己或他人性经验的细节描述或露骨的感受描述;
    2)涉及色情段子、两性笑话的低俗内容;
    3)配图、头图中包含庸俗或挑逗性图片的内容;
    4)带有性暗示、性挑逗等易使人产生性联想;
    5)展现血腥、惊悚、残忍等致人身心不适;
    6)炒作绯闻、丑闻、劣迹等;
    7)宣扬低俗、庸俗、媚俗内容。


5. 不实信息,主要表现为:
    1)可能存在事实性错误或者造谣等内容;
    2)存在事实夸大、伪造虚假经历等误导他人的内容;
    3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。


6. 传播封建迷信,主要表现为:
    1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
    2)求推荐算命看相大师;
    3)针对具体风水等问题进行求助或咨询;
    4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;


7. 文章标题党,主要表现为:
    1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
    2)内容与标题之间存在严重不实或者原意扭曲;
    3)使用夸张标题,内容与标题严重不符的。


8.「饭圈」乱象行为,主要表现为:
    1)诱导未成年人应援集资、高额消费、投票打榜
    2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
    3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
    4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
    5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序


9. 其他危害行为或内容,主要表现为:
    1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
    2)不当评述自然灾害、重大事故等灾难的;
    3)美化、粉饰侵略战争行为的;
    4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。


二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。


三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)

我知道了
恭喜你~答对了
+5羽毛
下一次认真读哦
成功推荐给其他人
+ 10羽毛
评论成功且进入审核!审核通过后,您将获得10羽毛的奖励。分享本文章给好友阅读最高再得15羽毛~
(羽毛可至 "羽毛精选" 兑换礼品)
好友微信扫一扫
复制链接