9th May, 2006

对信息过载的一点思考

前几天看到 keso的一篇帖子讨论信息过载,当时觉得离自己挺遥远的,心想自己那几十个feed离过载还很遥远,谁知只是五一短短的七天,积累的文章已经读的我喘不过气来了,这才发现信息过载离自己也并不遥远。于是 Google了把信息过载,看到了如下解决方法:

  1. 控制Feed数量,这个应该是最直接有效的办法了, 未完成的方法是设定一个每日必读组和一个观察组,如果对观察组中的feed观察一段时间后发现确实不错,将它加入到每日必读组,而如果每日必读组中的某个feed长期不更新或者忽然变得没有趣味,那就将它剔除出去。
  2. 使用过滤器(Filters)过滤掉你感/不感兴趣的内容,但是这样有一个缺点,就是它可能并不那么准,而且将自己的阅读仅仅局限在几个关键字也会失掉许多有用的信息。
  3. 基于社会化方法的过滤器,比如 del.icio.us/popular或者 抓虾的热文排行,大家都感兴趣的文章应该不错。但是人与人的阅读口味总是有差异,所以这样的feed中也或多或少会存在你不感兴趣的内容。

      上面的3个方法(后面两个来自 这里)其实归根结底都是一个思路,那就是想方设法减少Feed的数量。但是假设这样一种情况,如果有一个Feed,它出现好文章的几率是1/10(仅仅是假设),并且这篇好文章的主题并不固定,那该怎么办,取消订阅,必然错过这篇好文章,继续订阅,又会收到大量垃圾。

      keso的文章里谈到了一个思路,我觉得很好:

这种思路不可能依靠某种单一方法,它必须综合考虑个性化阅读、群体阅读和链接关系等多种因素,为每个feed乃至每篇文章,给出针对每个用户的不同的权 重。这样,你不会因为面对3000篇未读文章而精神崩溃,系统会为你选出100篇必读文章,300篇可读文章,以及2600篇可忽略文章。而且,在这样的 系统中,你多做几个动作,就越有利于让自己从信息过载中脱身。而在整体上,你的自利行为,又会成为一种利他的行为。

      总结起来就是为文章分级,用户可以根据文章的重要程度和自己的时间选择只阅读对自己比较重要的文章,但问题的关键是机器怎么知道哪些文章才是用户感兴趣的。顺着这个思路,我觉得目前的RSS阅读器可以考虑从以下两个方面入手:

  1. 增加文章关联功能,也就是把相同主题的帖子归并在一起,就像Google news中的相关新闻,如果用户对这篇文章探讨的主题感兴趣,它可以选择继续阅读这个主题的相关文章,如果不感兴趣,那么他就不会再看到这个主题的相关文章。不过不同于新闻,Blogger们为了吸引眼球,往往同一主题的文章标题也会大相径庭,而且个人的表达方式也千差万别,所以判断文章的相似性在技术上应该有一定难度。
  2. 为文章标记权重,权重的计算方式可以考虑豆瓣那样的“喜欢书A的用户也喜欢书B”。拿Google Reader来说,如果你给某个文章加了星标,同时还有10个用户也给这篇文章加了星标,他们中的9个人还给另一篇文章也加了星标,恰好这篇文档也被你订阅了,那么Google Reader就可以为你将这篇文章标记为“必读”。这种方法与del.icio.us/popular的区别是,你得到的是与你兴趣最为相近的用户推荐的popular,所以它最大限度的减少了你不喜欢的文章出现的几率。

    Google Reader的默认排序方法是auto,没有仔细研究,不清楚这个auto和用户加的星标有没有关系,不过仅仅通过星标来区分显得粒度过粗,最好能给每篇文章评定等级,我觉得至少要有三个等级:精彩,一般,垃圾。

      以上想法纯属拍脑袋,没有做过系统调研,不过不管会不会有阅读器提供这两个功能,随着RSS的逐渐普及,信息过载必然会引起各个RSS阅读器提供商的注意,相信在不久的将来,这个问题应该会得到较好的解决,目前,只能靠手动了。

      BTW,前几天从Digg看到 Dave Winer发起了一个 分享OPML的项目,它会根据一定的算法为你推荐你可能感兴趣的feed,可能是网络不好,没打开官方网站,不过我觉得原理应该跟我描述的第二种方法差不多,首先它需要了解你的兴趣,然后它会选择跟你趣味相投的人们普遍比较喜欢的feed推荐给你,如果有RSS阅读器能提供这个功能应该是个不错的创新,而且比单独的项目要简单许多,因为它不需要用户自己动手就已经知道了用户的OPML。

厚道s

这里面有个假设是你不需要也不可能阅读到所有的”好文章”,如果一篇文章真的对你有用,你始终有机会通过某种途径遭遇它,呵呵。

当然未来的发展方向一定是基于单篇文章的智能化方案

厚道,其实很简单

Your response:

Categories