2011年5月3日星期二

吉软糖:谁在推特污染aiww标签? 如何应对?

熟悉推特的人都知道,这是一个分布式的信息系统,人人可以自说自话,而说的话只影响到关注自己的人(也就是Followers),或者自己所@的人。但是 若要超出这个范围,便需要使用关键词搜索功能。一般人们习惯把#放在需要标识的关键词之前(也可以不放),把特定的信息聚集起来。这种方式非常有效,但是 也有一个致命的弱点,就是容易受到污染。也就是有些恶意的人(或者叫垃圾信息账户-Spammer)能将毫不相关或者虚假的信息加上标签发布到推特上,使 得其他查看此标签的人得不到有效的信息。

下面就#aiww这个标签做一个简单的分析。首先看一下典型两个垃圾信息账户。

账户1 @lidamink:

lidamink-top-spammer-on-tagoaiww

账户2 @eiuielk:
eiuielk-top-spammer-on-tagoaiww.png

其特征是发布一些虚假的或者不相关的信息,并且同时污染其它标签如 #cnjasmine。而且它们的关注者都非常少。

wumao-analysis-on-tagoaiww


上图(点击看大图)是用一个网络分析器搜集到的从4月26日到5月2日标签为#aiww的8000个推的统计信息。其中上面提到的两位发的推占据了排行榜的第一和第二的位置,分别是22.51%和22.43%。也就是10句推里面就有4.5句是这两位发送的。

如果你搜一下aiww,得到的结果大致就是这样(这里7条推里面只有2条不是恶意的,其中上面两位占据了4条):
search-aiww2

这就是这些垃圾信息发布者所要得到的效果。那么有没有对策呢?有。有些推友已经制作了列表把这些垃圾账户搜集起来,例如,最上面提到的账户2就被如下6个列表所收录:
wumao-list-top-spammer-on-tagoaiww.png

之所以称这些账户是五毛,大概是因为如果没有来自政府的金钱利益,很少人愿意干这种肮脏而且被人骂的活儿。

我特意把排在前10位的账户检查了一下,发现结果如下:
  1. @lidamink 发帖22.51%
  2. @eiuielk 发帖22.43%
  3. @ideletey 发帖6.20%
  4. @jchang_22079 发帖5.8%
  5. @xiazuhu 发帖3.38%
  6. @andingzirua 发帖3.27% 已被取消帐号(Suspended)
  7. @lalivea 发帖3.09%
  8. @liunianzhijian 发帖2.87% 已被取消帐号(Suspended)
  9. @nizhexin 发帖2.85% 已被取消帐号(Suspended)
  10. @bichunlong 发帖2.66% 已被取消帐号(Suspended)
让 人惊讶的是,这10个都是垃圾发送者,总共加起来占据了信息的75.06%(也就是8000个推里面6005个是由这十位垃圾发的。它们其中4个已经被取 消帐号(占推数11.65%)。被取消帐号的原因估计是推特管理员接到很多人举报,把这些账户确定为垃圾信息发送者,按照推特的规则取消帐号(因为推特显 然也不希望有太多的垃圾账户来干扰正常使用者,并增加服务器的负担)。如果你试图访问这些被取消账户的时候就出现如下图片:
Screen shot 2011-05-03 at 12.14.28 AM

那如何举报呢?非常简单,只需要到该账户的页面,点击右侧的齿轮图标,然后选第三个选项Report xxx for spam。
Report xxx for spam

由 上面的分析可以看出,推友们已经成功地把一些垃圾信息发布者赶出了推特,但是一些大的仍旧继续在作恶。对大多数人来说,这些垃圾发布者是不会影响他们的, 但是对于有些著名的网友就会被@回复的方式骚扰,下面就是一个使用这种策略的垃圾。你能看到它发一些毫不相干的推给@gaodongmei, @lihlii等人。

垃圾发送者 @型


有人可能会说,五毛也有发言的自由,这点我非常同意。但是当五毛们用恶意的手段来干扰你获取信息自由的时候,你就可以用手中的权利来Report Spam。


特此我制作了上面提到的前10个垃圾中还未被取消帐号的列表:

请使用你手中的权利消除这些垃圾。举手之劳,造福推友。

除此之外,大家也可以考虑用新的标签来聚集相关内容。比如,在使用#aiww的同时,也使用#aiwwnew,这样人们就可以使用这个新的标签#aiwwnew得到相对不受干扰的结果。

爱艾未未 -Love Ai Weiwei

没有评论:

发表评论