微博智能排序的一些思考

微博智能排序的一些思考

最近,新浪微博信息流默认排序方式从一开始的“按时间排序”更改为“智能排序”,其实智能排序这个功能早在6月18号就推出来了,只不过当时没有强制推送,并且入口不明显,没有引起大家重视,在最近新浪强制推送之后,引起了很多用户的反感,各种猜测和吐槽也随之而来,有人觉得这是强奸了用户,有人觉得这是要商业化的前奏,甚至把这个问题类比于百度搜索的竞价排名。

极客公园不参与吐槽,也不会去争执,仅就现象的问题去挖掘一些本质,供读者参考。

微博的信息梳理

微博的短板处理——信息过载

微博的智能排序,按照官方的说法是可以根据关注、标签和微博内容等相关信息,帮助用户梳理微博内容,对同类微博进行合并、对可能感兴趣的微博内容进行优先展示的排序功能。

先抛开大家所怀疑的商业目的或者内容的审查和其它,这至少说明一个问题,微博自己也已经意识到了自己的内容的重复性造成的信息过载,这是所有UGC网站的共同问题,解决时间线无效信息过多造成的信息过载。

知乎上的知友提出了 Facebook 的参考样本

信息过载之后,选择“数据算法”来“优化”信息质量,是web上常见的一种方式。Facebook著名的News Feeds开创了NFO( News Feeds Optimization),也一直饱受非议。这背后的关键问题是:到底什么样的信息才是重要的?根据关系?根据算法?根据我的点击?

通过算法来计算信息的重要性,是人类典型的无知:我们知道的越多,我们越无知。信息的重要性完全是人的直觉的感受,非常动态,无法计算。这或许也是人类其实值得骄傲的地方。

智能排序表面上会打乱信息排序,但是我不觉得用户会对此有明确的感知,毕竟信息太多,并且还是互相断裂的,时间的秩序感并不是那么重要。

我不觉得新浪微博的智能排序有什么阴谋,这其实是业界常规的一种处理方式。

在功能上,微博在智能排序上做了改进,只是由于新浪的强推,才会让用户觉得反感,微博在新功能的推送和引导方面,还有很大的改进空间。

时间线和信息流的整理的规则制定

对用户 Timeline 的梳理,把对用户更有价值的内容优先展示,这个是对抗垃圾内容获取微博信息价值的一种好办法,从出发点和优化微博的媒体属性来说不见得是一件坏事,其实最大的争议就是该由谁来制定整理和排序的规则。

假如把微博比喻为邮箱,当做你所有信息的收件箱,那么邮箱有一种情况,就是用户通过设置不同的关键词和规则将不同的邮件进行了分类整理,方便查找和处理邮件的内容,这属于用户自定义规则,如果这项功能在微博上体现,那就相当于微博关注的分类和制定过滤一些微博来源如“皮皮时光机”等源头发出的微博。只不过相比邮箱来说微博用户不一定愿意花时间去设定那么精准的规则和关键词,更何况,微博的媒体属性也决定了内容的千变万化和包罗万象,用户没有精力也不会花精力去制定和筛选有价值的信息。

邮箱还有一个功能就是智能过滤垃圾邮件,根据大多数用户的举报和关键词以及邮件来源的扫描,一般的邮箱服务已经提供了垃圾邮件的过滤功能,甚至能提供很高的判断率,把垃圾邮件封杀在邮箱之外,另外,QQ 邮箱还有一个类似于智能分组的功能——智能归档,在一定的时间积累过后会将你的某些邮件智能归档,并且,很多邮箱还提供了邮件的智能排序,将互动和联系较多的联系人的邮件前面加上重要的标识,这在一定程度上也是对邮件内容的整理,如果这个功能迁移到微博上,不就类似与微博的智能排序吗?只不过是展现方式的不同,算法和驱动给用户提供的,是有互动或者内容较为高质量的,筛选掉的,是有重复性提供的内容过载的信息,这至少从功能属性上说,是对用户有利的,只是还没有达到那么智能的程度,所以才会为用户所诟病。

而在目前看来,如果新浪来制定规则,对新浪来说非常有利,不管是对于微博信息的监管商业内容的推送,好比百度搜索结果的竞价排名。而如果由用户来制订,在一定程度上用户的关注分组已经实现了这样的功能,但是大部分用户不会设置关键词筛选或者排序机制来优化自己的时间线内容。

所以,这是一个功能型的硬需求,只不过微博在功能的完成上,还有很长的路要走。当然,这个问题不仅仅是微博一家需要面对和考量的问题,同类网站甚至于社交类属性的网站都会面临这样的问题,如果能有良好的技术解决类似于时间线的相关性排序及搜索方面的问题,将会出现一个类似于当年 Google PageRank 加权算法那样革命性的技术,以此来奠定  Web2.0 网站的高效使用及商业化基础。这会是一个突破性的创新,当然,在信息的质量和时间线权衡上面,也要做出相应的权衡。

商业化的质疑

有网友在信息智能排序的页面抓取到了广告的推送,这让人产生了这是否是基于商业化的目的去做这样的一个功能。

另一些方面,微博现在的智能排序是通过新浪自己的排序规则来制定内容的显示和推送,就很有可能造成由新浪一手来操控内容的现象,这对于内容的审查来说是一个不错的手段,新浪可以通过智能排序来决定你能看什么不能看什么,这对用户的信息获取确实是一个问题。

但极客公园认为,微博通过智能排序或许有商业化的考量,但是在目前 Web2.0 的问题上,时间线内容的筛选和搜索整理已经是一个迫不及待需要解决的问题,这关系着未来信息的呈现和展示方式甚至于传播方式的改变和革新。产品本身的形态不会是为了纯商业化的目的来做这样一个功能,但不否认会有一些商业化的考量,只是相比于时间线和智能排序上需要解决的需求来说,微博的智能排序远远算不上是为了纯商业目的来做的这样一个功能。(关于新浪微博的商业化问题,详见《新浪微博的商业化之困》

至于信息的审查,智能排序一定会造成用户有可能需要看的微博因为新浪智能排序的干预而看不到(这也是新浪智能排序被诟病的原因之一),新浪确确实实在“强奸”部分用户。我们不去深挖信息审查的问题,这不是新浪能决定的问题,这在一定程度上代表着媒体的某种属性和节操,并不是所有的媒体平台,都那么有底线和操守。

其实,即便没有智能排序,你确定你所关注用户的每条信息你都能收到吗?

另外,最近几天看到了很多的吐槽文章,各种角度都有,想说一句,吐槽可以解决你的内心不满的诉求,但是无助于问题的解决,微博该怎么做还是会怎么做,我们可以更理性的从产品的层面出发,通过如何优化产品形态和结构上去解决问题,叫嚣吐槽会博得眼球,但永远只是眼球。

新浪商业化时间线微博
下载极客公园客户端
iOS下载
反馈