专业IT科技资讯平台,关注科技、手机、电脑、智能硬件、电脑知识!
当前位置:主页 > 建站 > 技术分享 >

网站管理员面对垃圾内容,如何应对

导读:

  出于对网站自身发展的考虑,为了使搜索引擎能够提供更加公平的结果,为了维护互联网生态环境,以及

  出于对网站自身发展的考虑,为了使搜索引擎能够提供更加公平的结果,为了维护互联网生态环境,以及给网民提供更好的上网体验,我们认为web2.0站点或论坛版块里存在上述内容是非常不合适的,网站管理员应对垃圾内容进行重点清理,可以采取以下措施:
  1、删除垃圾内容,并将这些页面设置为404页面后,及时通过百度站长平台的死链工具提交死链列表。不仅令百度对站点的自我清理行为及时响应,更方便站点主动控制网站内容在搜索引擎的呈现情况。
  2、提高注册用户门槛,限制机器注册
  1)群发软件通常使用自动的程序探测论坛默认的注册文件名、发帖文件名。管理员可以不定期的修改注册用户文件名、发帖文件名;注册、发帖按钮使用图片;与程序默认的不同,可以防止被自动程序搜索到。
  2)发帖机通常是机器注册,行为模式单一。管理员可添加一些需要人工操作的步骤,有助于限制机器注册。 如:使用验证码;限制同一邮箱注册ID的数量,同时启用邮箱验证;使用更为复杂的验证机制;经常更换注册问答。
  3)除了在注册处设置门槛外,还可以控制新用户权限。如要求完成上传头像、完善用户信息等人工操作步骤后才开放发帖功能;在一定时间内限制新用户发帖;限制新用户发布带链接的帖子,待达到一定级别后再放开。
  3、严控机器发帖行为,如使用验证码、限制短时间内连续发帖等。
  4、建立黑名单机制,将群发常用词、广告电话和网址等加入黑名单,对含有黑名单内容的帖子进行限制或清除。黑名单应该不断维护,以堵截原有垃圾词汇发生变形和新生垃圾词汇。
  5、对站内的异常进行监控。发现注册量、帖子数,甚至站点流量爆增后,及时发现和查找原因。
  6、对站点内用户的行为进行监控
  1)部分异常用户的ID结构有别于普通用户,如使用无意义的字母数字、或几个单个汉字的无序组合,如:gtu4gn6dy1、蝶淑琴;使用商业词作为ID,如:轴承天地7、hangkongfuwu123。
  2)发布内容间隔过短
  3)发布的内容绝大部分非常类似
  4)发布的大部分内容里含有类似的特征,如某个网址、电话、QQ号码等联系方式
  7、不允许发布带有可执行代码的内容,避免弹窗、跳转等严重影响用户体验的情况发生。
  8、对部分web2.0位置提及的链接,使用“nofollow”进行标记,如:bbs签名内的链接、BLOG回复ID自置的链接
  http://cang.baidu.com/spamcase/snap/a3103920926c494f0e3030ad.html
  9、论坛中的广告、灌水版块,建议加上权限限制,或者禁止搜索引擎收录。
  10、关注建站程序的安全更新,及时安装补丁程序。保障用户账号安全,避免发生盗用正常用户账号或历史沉寂用户账号发布垃圾内容的情况发生。