信/息/过/滤

  • Posted on
  • by

很多人都知道,google聘请了一些数学天才研究算法,以优化搜索结果。但是,大多数人不知道还有一个部门,也在研究网民浏览的内容,并决定我们可以看到什么,以及不可以看到什么。它没有一个公开的名称,但是当你浏览一些它所敏/感的东西时候,你就能够感受到它的存在,它被称为g/f/w。

一般情况下,如果你发布一些让它很反感东西时候,它会直接通过空间商关闭你的网站直到你删除这些内容。如果空间商不在它的管辖范围内,那么国内网民在访问的时候会被提示找不到服务器。

一个偶然的机会,我发现g/f/w会对网页内容根据域名以及网民的点击行为进行过/滤。

如果你浏览的网页内容并不敏/感,那么当你继续浏览的时候,所浏览内容仅仅被监/视。但是,如果你浏览了包含敏/感/信/息的网页,那么接下来这个网站的其他之前没有被打开过的页面内容就可能会被过滤掉。

比如,你可以浏览http://www.veryword.com域名指向的任何网页,但是如果你浏览了 http://www.veryword.com/2006/10/post_60.html这个页面(包含代/理/软/件介绍及下载链接),那么接下来浏览其他之前没有打开过的页面都可能会有问题。我又根据同样的浏览次序试了http://veryword.com,发现是同样的结果。(veryword.com是顶级域名,www.veryword.com是其二级域名)。在IE和firefox下面反映的结果相同,可以排除浏览器的因素。我于是把网页下载到本地,发现可以正常打开,排除了网页本身的问题。因此,可以推断,网页内容在传输过程中经过了过/滤。

注:以上的点击行为是国外ip的用户点击放在国内空间的网页,至于国内ip的用户发生相似点击行为是否产生同样结果尚未被证实。

1 正常

p1.jpg

2 正常

p2.jpg

3 受管/制内容

p3.jpg

4 其他页面已经无法打开

p4.jpg

5 网页的代码,pagebody部分已经丢失

p5.jpg

6 下载到本地,网页显示正常

p6.jpg