2009互联网大会会于11月2日至3日在北京召开,腾讯科技作为官方指定战略合作门户网站、官方指定*合作新闻中心进行全方位的视频、图文采访与直播。特设立4个现场专访间,力邀业界专家与企业代表剖析产业现状,畅谈产业前景,并就金融危机一年来的发展进行深度解读。
以下是中搜总裁陈沛演讲实录:
陈沛:各位领导、各位来宾,大家下午好!很高兴能够在一年一度的*互联网大会上和大家分享对互联网的看法,另外搜索引擎相当长的时间应该说是互联网的热点。今天我的主题是关于第三代搜索引擎的。有很多人说中搜为什么最近不说很多话了?今天我也想跟大家汇报一下中搜在搜索方面的探索。
2003年的时候,我提出了第三代搜索的思想,当时我们虽然全力以赴在做第二代搜索,我们当时认为最早的搜索引擎是雅虎,上面有很多分类把网站和类别进行划分,现在我们谈到搜索会想起Google,在输入框里面打进一个关键词。
未来是什么样?中搜一直在尝试新一代的搜索,最近网上有很多关于第三代搜索的讨论,因为很多公司都在尝试一些搜索进行,虽然关于第三代搜索大家没有什么结论,但是很多人都引用了前两代的结果,以雅虎目录为代表导航的搜索和以Google为代表的关键词收入。
搜索一定会发生某种变革,一个是持续增长的互联网数据。5年前的今天互联网数据大大增长,每天以几何数据增长。我们单纯用技术的方式找到*的结果变得越来越困难,现在的搜索引擎主要是基于一些算法,在700万个结果中迅速做一个排序,让我们有机会在前几页中看到你需要的东西。如果互联网的内容越来越多,我们如何提炼前两页,会变得越来越困难。
第二,用户实际上也在进化,5年前我们在互联网上搜索几百条信息,大家就很满意了,但是现在每一结果甚至有上百万,但是很遗憾人的搜索能力有限,只能看前几页。用户的能力不断地细分,搜索的本质是用最短的时间得到自己想要的东西,而不一定是越多越好,搜索本身就是这样的。根据这两点,搜索一定会发生某种变革。
其实我们最近也能看到关于第二代搜索引擎的代表,他们也在尝试做搜索的变革。*个是Google,Google正在做整合搜索,他们使很多的垂直搜索整合在一个界面中。百度最近在推“框计算”,当然我们不是说所有的搜索都在一个框里面,但是“框计算”允许第三方的搜索引擎成为它的结果的一部分。某种程度上,这个和中搜的想法一致,中搜做了两件事,一个是开放,一个是聚合。
我们认为第三代搜索的本质一个是多方支持的融合,不仅仅是搜索引擎公司,因为搜索引擎公司掌握的能力是有限的。我们更多的是大数量处理能力。但是很多专业领域我们不具备这种知识。某种意义上我们希望搜索质量更高,可能需要更多、更专业的知识,这种搜索的结果需要有更专业的方式做,需要有一种合作的方式融合一种新的知识,当然它会变得更加专业化,包括领域化和更加个性化,这是我们认为新搜索可能体现的一些本质。
这里有一个关于张靓颖的页面,左上角是她的简介,来自于维基百科。其中有一个关于张靓颖的个人的新闻和张靓颖在新浪写的图片、博客和音乐,所有和她有关的东西完全被聚合在这一个页面上,这些内容每天自动更新。它看起来是一个门户,但是本质上是一个互联网,另外是一个被人加工的用新的方式呈现出来的。
拼装一个页面,不需要学习什么知识,它可以按照自己的理解把互联网的数据重新整合和展示,这也是我们认为的新一代搜索的新的条件,因为大部分没有能力利用计算机的技术再架构这些数据,他们希望用简单的方式再去构造自己的知识。
所以我们认为基于开放的平台,应该使普通用户参与这些内容成为一个可能。所以中搜这几年主要做的是开放的平台。当然所有的内容都必须由一个用户加工整理,它的覆盖面也会非常有限。
这里是一个贵州茅台的主页,和贵州茅台有关的股票信息、行业信息包括它的论坛都在一个页面上。当然这个东西做好的话,它也有快速复制的能力,所有的股票都会被复制出来,所以在财经的搜索里面,你可以看到针对所有个股的更完整、更及时的页面,当然它可能会成为新的搜索潜力。
当然搜索引擎的质量标准也不一样了,在新的搜索上,我们会提出更新的指标要求,比如说内容依然要全面,只是有更好的展示方式,它可能要更加准确,比如说我们要查自己的名字,我们会发现整个搜索引擎会给你一堆与关键词相匹配的内容,但是不是你想找的人。
现在第二代的搜索引擎某种意义上只是关键词搜索的匹配,离我们真正要找的内容有距离,对人显而易见的事,对机器来说是很困难的。所以我们看到很多不是我们需要的内容。如果有人的知识参与,这个结果可能会变得更加准确。
现在的搜索引擎只是一个关键词的匹配,它并不是一个智慧的关联,对未来说我们有更高的要求,我们希望描述的内容就是我们想要的内容,而不仅仅是关键词的匹配。因为是一个门户的展示方式,可以有一个好的方式,可以有一个美观的展示方式。所以这里面可能有新的标准。
这是《五星大饭店》是海岩的著作,所有的内容重新加工整理,依然覆盖互联网的各种内容,它的内容被加工和组织,以一种崭新的方式崭新出来,我想可能更多人愿意阅读这样的页面。
开放的本质实际上就是专业技术的融合,这也是第三代搜索引擎的本质,也是中搜这几年做的主要的工作。大家可以看到,在底层有各种各样的数据库,再往上是数据流,再往上是搜索的引擎,包括搜索的引擎,内容研发的引擎,包括web服务的引擎,当然这些东西对于大部分人来说可能都是陌生的、困难的。
中搜第三代开放的搜索引擎,在于这个平台上可以简单地与合作伙伴构造新的垂直搜索,比如我们和方正合作做图书的垂直搜索,还有番薯网是我们和方正合作的一个产品。它就是中搜的第三代搜索结合了方正对数字图书的理解,构建出的一个新的搜索和服务。
当然我们还可以和赛迪合作,也可以和专业领域擅长并且有愿望的人合作一个新的垂直搜索,这些垂直搜索共同构造了新的搜索,他们可以向现代的互联网提供某种专业的内容。现在的搜索引擎某种意义上可能是整个搜索引擎发展的必由之路。开放成为一个大的趋势。
第三方搜索本质的含义是什么?我现在搜索的一部分的结果可能不如别人做得更好,或者是别人的搜索可能成为我搜索的一部分,某种基础上也是对专业知识的一种认同。这是我介绍的关于第三代搜索引擎整体的思想,它体现了所谓的“开放”的思想。另外为了开放,必须有非常好的个性化的平台,可以非常简单地和不同的合作伙伴构造不同的垂直搜索,这是最近这年中搜做的主要的工作。
对于大部分的合作伙伴来说,底下那些复杂的,我们不太了解的和陌生的技术都不见了,只剩下一个开放的平台。按照自己的意愿构造自己的服务和搜索。
这是我们跟方正合作的番薯网,这是从番薯网里面看到的各个页面,都是中搜底层的技术构造的,无论从内容和形式来说都完全是一个垂直的领域。这是女性的频道。这是关于一个作家的所有的内容。
当然也可以是与出版社相关的内容。这里面我们很难区分它是一个图书的应用还是搜索引擎,因为这里面很多的内容来自于互联网,当它应该出现的时候就自动出现了,所以我们并不赞成再一个输入框里面实时获取一个信息的全部,我甚至说过比较极端的话,未来若干年人的所有信息都再一个输入框里面获得,那是人类的悲哀,因为搜索应该和所有的应用结合在一起。有时候你很难区分电子商务和搜索引擎,他们无处不在。