微软正式成立了一个重要研发机构——微软亚洲研究院互联网搜索技术中心(MSRA Search Technology ;Center)。 互联网搜索技术中心的成立旨在进一步加快微软在互联网搜索领域的创新及技术产品化速度,使微软亚洲研究院的创新成果更快地向MSN搜索产品转移,让层出不穷的新技术、新产品能够在第一时间为中国乃至全球的MSN Search用户所应用。 该机构计划在未来两年内大规模招聘。近期的招聘目标已锁定2006年国内外高校毕业的优秀研究生和本科生。 微软亚洲研究院副院长洪小文,作为互联网搜索技术中心的负责人表示,将会强化研究院与MSN的合作,开发出最适合中国人使用的搜索服务。洪小文副院长声称,现在的搜索仍处于“婴儿期”,以后的搜索将会更精确、智能,更加人性化,与OFFICE和移动手机的结合,“无处不在”的模式已经不远。微软高级副总裁里克?雷斯特也信心满满的表示,MSTC将会改变通过互联网、PC搜索的模式。 超链分析技术将成“明日黄花”? 目前,国内上网用户总量已达到1.03亿,“搜索引擎”以64.5%的选择率排在第三位,仅次于“电子邮箱”(91.3%)和“浏览新闻”(79.3%)。不仅是中国,全球互联网搜索业也呈现出强劲的增势。市场调查公司的研究和分析表明,2005年,该市场的规模将达到40亿美元,而在未来四年内,市场规模每年将以35%的速度增长。 从为用户提供目录式搜索分类服务的第一代互联网搜索引擎,到以人工目录分类为基础的网站搜索。随着互联网所承载的信息资源规模迅速扩展,第一代搜索引擎很快便无法满足人们查找信息的需要——于是第二代搜索引擎应运而生。它是以超链分析技术为基础的大规模网页搜索,可根据“关键词”的分布情况对页面进行分类和排序,并尽可能优先呈现那些“重要的”结果。在此领域的技术先驱包括了Overture、Inktomi、Altavista等公司,但因提供这种基于新技术的搜索服务而在世界范围内大获成功的企业却只有Google——凭借着“页面重要性分析”(PageRank)技术,还有成功的商业运作,Google避开了AltaVista等互联网搜索业先驱者被收购的覆辙,一跃成为全球互联网公司的佼佼者。 与第一代搜索引擎相比,第二代搜索工具能够为用户提供更广阔的搜索范围和更准确的结果,但这距离“完美的用户体验”依然很远——即便是结合了IR Score和PageRank网页重要性评估,今天的搜索引擎仍不足以满足日渐复杂的用户需求。例如,以页面文本为单位的数据搜索仍不够精确——如果把文本视作一维信号,那么网页所提供的则是有组织的二维信号。任何一个网页上的某些区块(像文章标题与内容区、图片及注释区、相关链接区)的重要性都要比另外一些区块(像广告链接区、网站信息区)高得多,而现有的搜索技术无法智能辨析这一点,进而为用户提供更准确的查询结果。 再如,PageRank是根据搜索引擎所“认定”的页面特性来区分网页的重要性,由此形成的“网页等级”往往不尽合理——当搜索引擎以链接指向的数量以及包含链接的网页的“重要性指数”作为某个网页重要与否的依据,肯定会遗漏或“轻视”一些可能对用户至关重要的网页及信息。而且,个别网站也可以通过作弊来改变页面的优先级。 用户的反馈也证实了这一点——同样据CNNIC的调研报告,关于“在互联网上查询信息时遇到的最大问题”,44.6%的用户认为是“重复信息太多”,27.5%的用户认为是“信息太陈旧、更新缓慢”,另外还有不少用户认为“查到的有用信息太少”(10.7%)或“信息查找不太方便”(10.2%)。换句话说,以超链分析技术为基础的第二代搜索引擎已成“明日黄花”,网络搜索业巨头正在竞相对“下一代互联网搜索”展开研发。 |