导读:本文通过一些数据,首先说明了移动搜索行业广阔的用户基础和发展空间,当前移动搜索行业的发展情况和竞争态势,以及移动搜索竞争将给诸多引擎公司带来广阔的生存环境和发展空间。然后阐述了水平搜索和垂直搜索这两个主要技术中,创新的垂直搜索技术将更适合移动搜索应用,同时简单介绍了移动搜索固有的平台优势,并认为移动搜索引擎服务商必定会提供比互联网搜索更丰富多彩的内容和运营模式,成为新的淘金时代和里程碑。
“人类对信息的渴望注定使互联网将来的发展迅速普及,这些将改变人类的生活习惯,也将进一步导致信息的爆炸式增长”,早在上世纪80年代末,美国人就已经预言了今天互联网应用的一幕幕,而如今谷歌、百度的产生和发展壮大,则是网络信息内容深入应用的结晶和升华。业界权威数据显示,2005年中国搜索引擎运营商收入规模达到10.4亿元人民币,比2004年增长了81.9个百分点,比2001年搜索引擎起步阶段的0.5亿元翻了20倍。随着搜索引擎的使用逐步融入网民的日常生活,以及企业用户对网络营销方式的逐步认可,2006年中国搜索引擎运营商的收入将有19亿元的规模,到2010年时,预计将达到100亿元的市场规模,年增长率达到41.2%。2006年中国的搜索引擎用户已有1.19亿人,占中国互联网用户的88.1%,而到了2010年时,中国的搜索用户将有2.16亿人,占中国互联网用户的93.1%。2006年中国平均每天使用搜索引擎的用户数量将有9520万人,每个用户日均使用7.7次搜索引擎。而到了2010年底时,每天使用搜索引擎的用户数将近2亿人,用户日均使用搜索引擎次数也将有12.1次。
与此同时,中国的移动用户数量正以每月500万的速度增长,截止2006年底,全国移动用户数已经达到4.5亿。在移动增值业务方面,短信一直是其盈利的中流砥柱,但随着彩信、WAP的逐步升温,手机上网和下载等电信增值业务正成为运营商新的盈利增长点。尤其是3G的到来,将为彩信、WAP等业务带来广阔的发展空间。
从数字上不难看出,中国目前的互联网用户和移动用户的数量比接近1:3.5,而最新的权威统计表明,手机和电脑的用户附着时间长度比为12:2。由此表明,一旦移动搜索概念在中国得以普及,并有着适合的资费体系和营运模式,其使用次数将远远高于互联网的搜索使用次数。很多业内专家预言,移动和搜索的强强联合,将创造移动增值业务的新淘金时代。
2、移动搜索行业的发展和竞争
正是因为移动搜索有着如此广阔的用户基础和发展空间,从2004年下半年开始,移动搜索这个关键词在谷歌和百度信息库里面的使用频度就逐渐多起来,到了今天,移动搜索已经成了移动领域和搜索领域最热门的话题之一,多家巨头公司已经开始行动。
2007年新年伊始,中国移动与谷歌联合宣布,双方将共同在中国提供基于移动和互联网的搜索服务。据了解,未来中国移动的用户可在手机上使用谷歌搜索服务,用手机上网将不再是简单搜索下载图片、铃声,还可以得到各种资讯。根据计划,谷歌将利用其移动搜索技术为中国移动的“移动梦网”提供移动搜索服务。中国移动用户可方便地搜索“移动梦网”上的大量内容。1月9日,谷歌又宣布同三星电子结盟,预装谷歌服务的三星手机将在功能菜单中加入谷歌标识,同时设定了专门的快捷键,方便用户一键访问谷歌服务。
微软在2006年3GSM世界大会上宣布收购专为移动运营商和移动互联网提供搜索技术的MotionBridge,该公司总部位于法国巴黎,是移动搜索技术的全球领导厂商。它目前正通过与欧洲和北美的主要移动通信公司合作,为客户提供移动搜索技术。微软表示,“新兴的移动搜索领域具有重要的战略意义,对实现我们的Windows Live™愿景至关重要,这个理念即通过各种设备为个人和企业提供丰富的无缝信息体验。通过收购,我们将继续为移动运营商提供工具,令其能够最大限度地提高其内容和数据网络的价值,并为移动用户提供强大的搜索引擎和更加丰富的搜索体验。”虽然将搜索技术内嵌到手机与以前有所不同,但殊途同归,目的都是一样的,那就是攫取移动搜索的蛋糕。
在国内市场,我们终于看到搜索老大百度也开始动作了,近日,百度联手诺基亚正式开始了自己的手机搜索业务。据悉,双方的合作领域将包括中国内地、香港和台湾在内的中文市场。百度战略发展和合作部总监任旭阳表示,此次合作只包括诺基亚基于S60平台的手机(包括诺基亚N70、诺基亚N90等)用户,将可通过双方共同设计的友好的搜索菜单,以无线方式直接接入百度搜索服务,内置该应用的手机于今年上市。
随着不断发展,行业竞争也日趋白热化。此前,谷歌也与摩托罗拉、索爱乃至英国最大的移动运营商沃达丰签订了搜索服务的协议。百度和诺基亚在中文市场的合作显然是有意针对和谷歌较量的,相信这个市场的竞争也会逐步升温。诺基亚在中国市场的龙头地位也给百度带来新的机会,毕竟中国的手机用户数量及增长之快,是其他区域无法比拟的。
以前大家讨论移动搜索都是雾里看花、纸上谈兵,现在关于移动搜索的商业合作不断出现,而且都是商业合作的大手笔,算是移动搜索真正落地了。显然,移动搜索时代即将到来了。搜索+手机,这种结合一定会充分扩展搜索在固定互联网中的魅力,谱写移动搜索新的篇章。手机拥有了搜索功能,将会使手机从功能上得到增值,手机用户获得信息的能力将发生根本性的改变,这将大大增强手机用户对利用手机获取信息的依赖程度,另外也会激发更多的人通过手机搜索资讯。
虽然移动搜索刚刚兴起,传统巨头们也开始了圈地运动,但移动搜索年代,将不再是“运营商搭台,巨头唱戏”的年代。换言之,传统巨头们依靠强大的资金实力和技术实力,将成为移动搜索概念市场培育的先行军,这恰恰为后起之秀们节省了高昂的概念传授和市场引导费用。而移动搜索因为先天的诸多限制,例如终端屏幕大小、操作难易程度、资费、流量、网络响应速度、信息采集受限、终端带电时间等,注定是巨头们当前最核心的数据,这是无法原封不动的搬运到移动搜索平台上的,这也就注定成为巨头们很关心的技术核心。
举一个简单的例子,用户搜索“深圳华侨城附近的游乐中心”,基于互联网的搜索引擎经常回复诸如“。。。深圳华侨城某游乐中心因整改停运。。。”之类用户不需要的答案。如果这类答案出现在手机屏幕上,其用户体验效果将最终让用户失去信任。
正是因为互联网搜索引擎结果的“散、全、浅”这些弊端,造成了向移动搜索进军的瓶颈和门槛,“专、精、深”的搜索效果也就逐渐成为移动搜索业界的核心技术课题之一。这也就为诸多的移动搜索引擎公司提供了广阔的生存和发展环境,谁拥有了“专、精、深”搜索引擎技术和权威行业数据,谁就有机会成为该行业的领头羊。正如业内权威人士预计:“互联网搜索年代,最终能够生存并得以茁壮成长的搜索引擎公司只能有几家,而在移动搜索行业里,因为移动领域的先天用户基础和移动终端的随时、随地、随身优势,甚至有可能在每个行业里都会有几家生存下来并茁壮成长”。
在海量信息搜索领域,目前存在两个主流技术体系。第一类技术业界称为水平搜索引擎技术,第二类技术业界称为垂直搜索引擎技术。前者就是谷歌、百度等巨头们所采用的核心技术,后者在国内目前则由少数几家公司所掌握,并正在通过移动搜索产品的开发,逐步成熟和完善。下面将通过介绍两种技术的主要区别,来说明移动搜索更适合采用垂直搜索技术,并应该在此基础上逐步创新。
我们可以把信息比作为海洋里面的资源,水平搜索引擎关注的是海洋的面积,注重海面上的资源采集,垂直搜索引擎关注的是海洋的深度,注重某一特定海洋资源进行深度挖掘和采集。当前互联网搜索引擎的信息收集范围只占到实际存在信息量的1%-2%,而98%以上的信息是存储在企业或行业内部的,这些信息是无法被搜索引擎的自动信息收集技术所能获取的。
数据源锁定直接导致通过互联网的水平搜索寻找信息时,搜索返回来的都是字面上相关的信息,但当用户在结果中进行深度搜索时,其信息的完整性、准确性和实时性就无法满足用户的需求。因此水平搜索对那些没有结构深度的信息,会较好的满足用户需求,例如新闻、论坛等,但对于那些有深度的信息,例如车票信息、股市行情等,就必须有特定的、实时的、准确的信息源支持。
水平搜索技术领域最著名的采集技术就是“网络爬虫”技术,通过网页间的链接去不断地请求访问新网页,其核心技术之一就是通过大量的统计和网页内容识别技术,尽可能收集有用信息,忽略不相关的信息,里面用到了很多人工智能技术。尽管如此,因信息仍然是爆炸式增长,其网页的形式也是日新月异,这就需要不断地更新网页识别知识库,有时会导致信息的实时性和准确性降低。因此,基于这种准人工智能的方式采集数据,准确度达到80%就已经是很优秀的结果。幸运的是,水平搜索技术依托电脑终端以及宽带上网,人们似乎感觉不到不准确信息带来的麻烦。
垂直搜索引擎的信息采集技术则主要应用在行业内部,使用定向采集技术和“网络爬虫”技术的结合方式。定向采集技术是通过对行业信息的整理、分析、归类,通过“按需采集”方式,准确组织数据。因为是行业内部应用,信息的形式和结构具有很多共性,“网络爬虫”通过按行业需求量身定造,有的放矢,其准确度和信息相关性要明显高于水平搜索的盲人摸象式的识别技术。
水平搜索技术在建立数据检索时,主要通过关键词的词频、词长、文章长度等各种综合参数来检索,因此其后面要有一个庞大的关键词库和统计库去支撑,并不断地去维护和更新这个词库。例如“满城尽带黄金甲”全国播放之后,论坛新闻里面频繁出现了“黄金甲”这个词汇,其词频等参数不断地变化,通过更新词库和统计库,在对新的文章建立检索时,就增加了以“黄金甲”作为关键词进行拆词的机率。因此,水平搜索引擎在维护词库和建立索引方面具有很强的学习性,但也正因为不具备先知性,由此降低了实时性和准确性。
垂直搜索技术因为是面向行业的,通常来讲,在某一个特定行业,其关键词数目要远远少于水平搜索引擎关键词数目,因此可以由行业专家来定义和维护行业词库,并且其关键词通常具有很强的先知性。例如对于房屋租赁行业,其行业描述属性无外乎包括地域、户型、交通、价格、物业等等,这就为行业数据整合成结构化数据奠定了基础。其关键词类似于望京、长安街、三房两厅、月3000、酒店式物业等等,其关键词的数目是有限的,因此没有必要建立庞大的关键词统计库,只需建立行业词库即可,按照行业关键词拆词建立检索,其准确度明显高于水平搜索引擎。之后通过量身定造的行业“网络爬虫”技术,针对行业内部的文章和论坛等建立非结构化检索方式,在行业内的搜索准确度明显提高。
总之,水平搜索采用非结构化数据方式,来包容数以亿计的数据和无数个行业,以此保全了信息的庞大,但失去了信息的精准。垂直搜索采用结构化和非结构化结合的方式,定向、垂直面向行业信息,既保证了行业内信息的覆盖,又保证了信息的精准。
水平搜索既然是面向所有行业的,因此各个行业的信息从采集、检索到显示,都不分行业的。这充分说明了它先天的行业包容性特点,但也暴露了他不具备行业个性化的弱点。
垂直搜索引擎面向行业,就必须解决行业数量的局限性,这样才能让采用这种技术的公司,有着广阔的行业业务发展空间,因此就必须采用面向行业的智能调度技术。
为实现智能调度,需要建立一个成熟的行业调度词库,以及相应的关联词库。同时需要解决的是二意性问题,即某些行业之间的关键词是相同的,单独从关键词本身不能确定应该调度到哪个行业,因此上下文技术在这里被广泛的采用。例如:“我想在东二环租房公司附近吃川菜”和“我想在东二环附近租房”,二者虽然有很多相同的关键词,但通过关键词上下文逻辑解析,即逻辑矩阵,二者会分别调度到餐饮行业和房屋租赁行业。
这样,通过基于行业词库的智能自然语言拆词检索技术、上下文技术、智能逻辑解析技术以及行业调度技术,就能很好的解决垂直搜索引擎在跨行业搜索的局限性。
垂直搜索引擎的最大特点之一就是能够针对不同行业的需要,量身定造不同行业的多维业务信息处理,这个特点也是当前水平搜索引擎所不具备的。
由于垂直搜索技术是采用面向行业的结构化数据,通过智能解析和行业调度,将行业相关的关键词作为多维的业务参数调度到行业的业务信息处理,剩下的就是在行业信息内部,如何制定个性化的行业业务处理和信息处理流程,并通过对搜索结果和表示方式进行业务相关的整合,以此来保证信息的相关性和准确性。
当前从搜索行业的发展来看,水平搜索在面向信息的广度方面已经很成熟,并也逐步开始面向行业,寻求垂直业务突破口,例如现在谷歌已经推出了本地搜业务,但其技术核心已经脱离了原有的核心,只是在信息数据方面有很多的共享基础。而垂直搜索引擎在行业内部的信息处理方面也已经成熟,追求的目标是如何吸纳更多的垂直行业,逐步拓宽服务行业和领域,这说明二者在完善的方向上是互补的。
从搜索行业的应用来看,水平搜索已经在互联网上占据了坚不可摧的位置,并且已经让互联网用户形成了依赖。垂直搜索因为其搜索结果精准的特点,正逐渐被越来越多的移动搜索服务提供商选中,其技术和应用也在逐步走向成熟。这说明二者在应用的环境上也是互补的。
两种技术发展的终极目标则是相同的,不妨称作“垂直门户搜索引擎”,垂直代表垂直搜索的特点,门户代表水平搜索的特点。不难看出,在当前信息时代,把人类所有行业的所有信息都放在一个搜索引擎下面,是不现实的。因此,根据应用平台的不同选择合适的搜索技术才是明智的。事实也将证明,垂直搜索技术将是移动搜索的最佳选择。在此基础之上,两种技术充分互补,共同发展和创新,创造更多的运营模式,才能为不同平台的用户提供更好地服务。
从这些年搜索引擎的发展来看,未来搜索引擎必将从单一化走向多样化、从水平化走向垂直化、从大众化走向个性化,这为诸多搜索引擎公司的百花齐放和蓬勃发展带来了广阔的空间。水平搜索和垂直搜索引擎技术具有很强的互补性,在移动搜索领域,移动搜索引擎公司采用垂直搜索引擎技术,将有更加优质的用户体验。移动搜索的先天平台优势,从互动性角度看,将为更多运营模式创造更丰富的内容。随着移动搜索引擎概念逐渐理解和深化,以及各个行业的商家的关注热度的升温,移动搜索引擎必将蓬勃发展,最终成为横跨移动领域和搜索领域的一个新的淘金时代和里程碑。