推荐一切不可推荐的新闻

摘要

人能够给机器纠错,可以事先读取出新闻刚刚出现时的价值,在机器做出选择之前就能进行预判。尤其是在一些大的新闻事件上,训练有素的编辑仍是目前多数新闻产品所不可或却的核心力量。

前不久著名研究机构 Pew 发布的一项报告,称社会化新闻网站 Reddit 的用户已经占到了所有美国成人网民总数的 6%,相应的 Reddit 的估值也高达 4 亿美金。不过如此火爆的新闻网站却在保持自身的独立性方面出奇的用心,它们就像 Google 在自己的网站介绍里写的各项宗旨一样,有自己的“十不”原则,包括不做广告、不参加流量交易、不强迫注册等等。自成立以来,Reddit 关注的焦点似乎一直放在内容本身,其 Web 站点从未做过重大改版,始终提供给用户简单直观的界面,并且让用户可以自由创建规模更小内容更专一的社区,使得网站的用户数持续增长并保持整体的活跃度。

从网摘到推荐

其实与 Reddit、Delicious、Digg.com 类似的网摘产品在国内从来不少见,比较知名的有 QQ 书签、百度搜藏,以及 Delicious 的中国版美味书签等。2008 年,同样主打网络收藏功能的抽屉网曾一举做到了业内第三。然而随着网摘热潮的退去,纯工具性的网摘逐渐失去光辉。直到 2011 年,抽屉网重新组建团队推出了抽屉新热榜,并在 2012 年开始发布移动客户端,成为 Reddit 模式在国内的忠实拥护者。

按照目前各种新闻类产品的内容挑选模式,可以大致分为三类:

  1. 人工编辑:代表就是四大门户,它们的每条新闻都是经由编辑挑选和修改后发布的;

  2. 机器筛选:典型代表就是当前很火的今日头条,它通过机器筛选出网络上的热门新闻,其中并无编辑的过多介入;

  3. 机器抓取+人工干预:代表是抽屉新热榜,它在机器算法之外同样强调编辑对内容呈现的把控。

目前用户在抽屉新热榜的内容推荐机制中权重越来越大,编辑的比重虽然有所减少,但依然处于重要位置。抽屉的编辑会将出现超过 24 小时的段子、图片等从新闻列表中剔除以确保整体内容的新鲜度;同时,另外一些不会被传统新闻门户推荐到醒目位置的内容却可能会在抽屉新热榜中居于高位。这就是抽屉新热榜所遵循的编辑理念:推荐一切不可推荐的。

从机器到人

在一款纯然由机器算法驱动的新闻产品里,不可避免地会遇到内容窄化的问题。一般来说,机器摘取新闻的主要标准有两方面:新闻的热度和用户的兴趣。这两个标准同时得到满足的内容往往能够获得机器的优先推荐。但从新闻的重要性、时效性、相关性三个维度来看,目前的机器算法虽然能够基本满足后两者,但是依然对重要的新闻缺乏必要的感知。比如在地震、洪灾之类的重大新闻专题报道上,基本是由人工来完成,机器难以从大量的即时新闻中筛选出最具价值的部分。另一方面,机器在不断“迎合”着用户的口味,但用户关注的焦点可能是分散的,经过机器推荐的内容可能会遗漏用户同样感兴趣的资讯。这就导致用户看到的新闻会越来越“少”。

由人或者机器挑选出来的新闻的最大区别可能正在于:前者是活的,有人格有个性;而机器推荐内容可能缺乏人的气息。机器是群体智慧的结合,人是个体智慧。人能够给机器纠错,可以事先读取出新闻刚刚出现时的价值,在机器做出选择之前就能进行预判。尤其是在一些大的新闻事件上,训练有素的编辑仍是目前多数新闻产品所不可或却的核心力量。


拓展阅读:

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。