UGC社区类产品系列1:违规内容的处理

最后更新于:2013-04-17 16:13:21

景德镇是一个文明和谐的国度,而我们时刻要保持互联网环境的干净。但对于UGC社区类产品,内容是用户创造的,平台只能即时发现及时处理。倘若不干不净的信息被网警盯上了,可能不会向你打任何招呼,直接拔掉网线了。

所以,在景德镇干产品,你还得学会一件事:如何快速高效处理违规信息。

UGC社区类产品系列1:违规内容的处理

UGC社区类产品系列1:违规内容的处理

按照内容传播环节,扼杀在摇篮里是最保险的,即提交后自动处理。但总有漏网之鱼还是没法被干掉,那就只能在传播中解决掉。

提交后如何识别并自动处理

如何自动识别和处理,需要搞清楚内容包含的信息载体元素和发布内容的行为模式。

信息载体上,内容可分为文字、图片、音频、视频,其中对文字的处理手段最成熟,即关键词、URL等特殊文本信息过滤,图片、音频、视频,恶意URL链接地址识别。这个过程时间极短,系统只能通过词库或者二维模型做简单运算并给出是否发布成功的提示,不能做过多运算。如BBS、CMS都采用此过滤法处理。

传播中如何识别和处理

行为模式上,对用户所处地理位置(IP识别、地域识别)、访问方式(登录行为方式停留时间、是否立即发布后离开)、内容发布行为(发布频率、提交速度如何)、账号资料(昵称、邮箱是否有无规律;是否间隔更换账号登录、账户之间是否同一批次注册等)、社交关系(是否与马甲账号关联、是否有真实社交关系存在、是否参与互动),通过这些维度建立模型进行用户过滤(是否禁用账号),内容过滤。这个过程需要系统强大的运算,故在发布后进行处理。比如搜搜问问违规问答发布后几分钟被清理,就是采用的此方法。

对机器无法识别处理的内容,比如一些文字内容中关键词隐喻(正话反说、哑谜等手法)、拆分(如装13)等处理手法,机器没法识别,可采用用户举报功能。系统通过收集用户反馈,对内容进行协同过滤。比如新浪微博大多数内容的有举报功能。

但也有特殊情况,内容发布的时候不违法规则,但发布后造成了不良影响被判为违规内容了。这时候通常采用系统管理员立即进行人工清理。如新浪微博李开复事件禁言三天。

对违规内容处理手段

对违规内容,一般采用前台清理后台数据保留的做法,严肃的,数据全部清理。又或者采用仅发布者可见,其他用户不可见。或者内容排序垫底靠后不靠前显示,让违规内容直接淹没掉。

看完你会发现处理违规内容的过程,其实和推荐引擎的工作原理挺相似的。最开始一层过滤需要快速响应,类似推荐引擎的冷启动,第二层、和第三层过滤,就需要采用离线数据模型和在线隐性行为模型(系统对用户交互产生的数据反馈分析)和显性行为模型(其他用户举报的反馈数据分析)结合分析过滤掉。

本文虽然写的有点硬,但还是较好理解。主要分享的是一种思路,处理此类问题的方式。产品同学在具体工作实践中,可以结合自己的产品找出维度建立过滤层级模型使用。

相关系列:UGC社区类产品系列2:如何让用户创造内容

《“UGC社区类产品系列1:违规内容的处理”》 有 49 条评论

 1. 佳超说道:

  借鉴了

 2. 剃刀Roikay说道:

  挺简单一东西,写的好复杂呀

 3. […] 前几天写了 UGC 社区类产品系列 1:违规内容的处理。今天继续该系列,聊一下如何让用户创造内容。 […]

 4. […] 前几天写了 UGC 社区类产品系列 1:违规内容的处理。今天继续该系列,聊一下如何让用户创造内容。 […]

 5. […] 本文地址:http://www.gauin.com/ugc-shequ-chanpin-weigui-neirong-chuli.html 分享到: 新浪微博 腾讯微博 人人网 开心网 Twitter QQ空间 更多 var […]

 6. […] 但谁会关心那些千千万万不可见的低质量内容和垃圾内容呢,这个不重要。如何处理内容,看系列 1。凸显优质内容,决定了产品气质和定位,这才是重要的。 […]

 7. […] 但谁会关心那些千千万万不可见的低质量内容和垃圾内容呢,这个不重要。如何处理内容,看系列 1。凸显优质内容,决定了产品气质和定位,这才是重要的。 […]

 8. […] 前几天写了UGC社区类产品系列1:违规内容的处理。今天继续该系列,聊一下如何让用户创造内容。 UGC社区类产品系列2:如何让用户创造内容 […]

 9. […] 前几天写了UGC社区类产品系列1:违规内容的处理。今天继续该系列,聊一下如何让用户创造内容。 […]

 10. […] 前几天写了 UGC 社区类产品系列 1:违规内容的处理。今天继续该系列,聊一下如何让用户创造内容。 […]

 11. […] 前几天写了UGC社区类产品系列1:违规内容的处理。今天继续该系列,聊一下如何让用户创造内容。 […]

 12. […] 前几天写了UGC社区类产品系列1:违规内容的处理。今天继续该系列,聊一下如何让用户创造内容。 […]

 13. […] 前几天写了UGC社区类产品系列1:违规内容的处理。今天继续该系列,聊一下如何让用户创造内容。 […]

 14. […] 前几天写了 UGC 社区类产品系列 1:违规内容的处理。今天继续该系列,聊一下如何让用户创造内容。 […]

 15. […] 信息泛滥,就应该直接过滤掉不该展示的信息,让受欢迎高质量的内容得到展现 […]

 16. […] 前几天写了UGC社区类产品系列1:违规内容的处理。今天继续该系列,聊一下如何让用户创造内容。 […]

 17. […] 信息泛滥,就应该直接过滤掉不该展示的信息,让受欢迎高质量的内容得到展现 […]

 18. […]  来源:投稿,作者Gauin,微信公众账号Gauin’s Blog,原文链接。 […]

 19. […]  来源:投稿,作者Gauin,微信公众账号Gauin’s Blog,原文链接。 […]

 20. […] 前几天写了 UGC 社区类产品系列 1:违规内容的处理。今天继续该系列,聊一下如何让用户创造内容。 […]

 21. […] 原文来自Gauin’s Blog,收藏下来,以当资料 […]

 22. […] 原文来自Gauin’s Blog,收藏下来,以当资料 […]

 23. […] 4月初写了UGC社区类产品系列1:违规内容的处理、UGC社区类产品系列2:如何让用户创造内容。前2节反响不错,今天继续该系列,聊一下内容如何流动。 UGC社区类产品系列3:内容如何流动 […]

 24. […] 但谁会关心那些千千万万不可见的低质量内容和垃圾内容呢,这个不重要。如何处理内容,看系列1。凸显优质内容,决定了产品气质和定位,这才是重要的。 […]

 25. […] 但谁会关心那些千千万万不可见的低质量内容和垃圾内容呢,这个不重要。如何处理内容,看系列1。凸显优质内容,决定了产品气质和定位,这才是重要的。 […]

 26. […] 原文地址:http://www.gauin.com/ugc-shequ-chanpin-weigui-neirong-chuli.html 标签: 更多 上一篇时光机:10年前的各大网站首页是什么样子【草榴7年不变的容颜】 […]

 27. […] 之前曾写过 UGC社区类产品系列1:违规内容的处理、UGC社区类产品系列2:如何让用户创造内容。这次,聊一下内容如何流动。 […]

 28. […] 前几天写了UGC社区类产品系列1:违规内容的处理。今天继续该系列,聊一下如何让用户创造内容。 […]

 29. 不纯粹文人说道:

  同意!第一步机器简单审核,其次就是用户之间的监督。UGC形式内容庞大,人肉审核不现实

 30. […] 之前曾写过 UGC社区类产品系列1:违规内容的处理、UGC社区类产品系列2:如何让用户创造内容。这次,聊一下内容如何流动。 […]

 31. […] 前几天写了 UGC 社区类产品系列 1:违规内容的处理。今天继续该系列,聊一下如何让用户创造内容。 […]

 32. […]  来源:投稿,作者Gauin,微信公众账号Gauin’s Blog,原文链接。 […]

 33. […]  来源:投稿,作者Gauin,微信公众账号Gauin’s Blog,原文链接。 […]

 34. […]  但谁会关心那些千千万万不可见的低质量内容和垃圾内容呢,这个不重要。如何处理内容,看系列1。凸显优质内容,决定了产品气质和定位,这才是重要的。 […]

 35. 弗洛缺德说道:

  相当大的一部分资源都被浪费到这件事儿上了。

 36. […]  前几天写了 UGC 社区类产品系列 1:违规内容的处理。今天继续该系列,聊一下如何让用户创造内容。 […]

 37. […] 前几天写了UGC社区类产品系列1:违规内容的处理。今天继续该系列,聊一下如何让用户创造内容。 […]

 38. […] 但谁会关心那些千千万万不可见的低质量内容和垃圾内容呢,这个不重要。如何处理内容,看系列1。凸显优质内容,决定了产品气质和定位,这才是重要的。 […]

 39. […]  来源:投稿,作者Gauin,微信公众账号Gauin’s Blog,原文链接。 […]

 40. […] 但谁会关心那些千千万万不可见的低质量内容和垃圾内容呢,这个不重要。如何处理内容,看系列1。凸显优质内容,决定了产品气质和定位,这才是重要的。 […]

 41. 2019说道:

  2019…

  2019…

 42. […] 前幾天寫了 UGC 社區類產品系列 1:違規內容的處理。今天繼續該系列,聊一下如何讓用戶創造內容。 […]

 43. […] 前几天写了 UGC 社区类产品系列 1:违规内容的处理。今天继续该系列,聊一下如何让用户创造内容。 […]

发表评论

您的电子邮箱地址不会被公开。