| 近年来,搜索引擎的使用越来越广泛,用户对搜索引擎的性能的要求也越来越高。有人预测,未来的信息获取方式将不再是通过门户网站,而是通过搜索引擎。
对于简单的搜索请求,比如用户搜索“感冒”,普通的搜索引擎可能只会返回“感冒”的一些东西。可是,有一些用户会有这样的一些需求:比如某一天,用户感到身体不适,他想知道自己得了什么病,那么他输入“发烧”、“咳嗽”等关键词后,搜索引擎应该能返回感冒这个疾病,以及一些相关的病症及治疗方法。或者,由感冒可以诱发支气管炎,那么搜索引擎也应该能够返回支气管炎的相关搜索结果。“感冒”和“支气管炎”在文字上并没有相关性,但是在语义上有相关性,这就叫做语义相关性,以下简称相关词。
相关搜索,是通过一定的技术,使得用户可以由某一个检索词,不仅得到该检索词的检索结果,还可以得到与该检索词相关的其他项的检索结果,为用户提供相应服务的一种增值服务。
基于Baidu的相关搜索的关键在于,怎么样实现这样一种语义上的相关性,让搜索引擎可以自动识别。但是目前这种相关词的相关性的获取方式有限,现在的做法是预先用xml定义一个相关词表,供搜索引擎查询。
这里就需要语义网的一些相关知识。需要有一个相关词词典,用来保存所有语义上相关的关键词的集合。也就是说,两个查询词可能对应于同一概念。程序若要进行两个数据库之间信息的比较和合并,它就必须了解这两个查询词表示的是同一事物。在理想的情况下,对于遇到的任何数据库,程序必须有办法来发现这种同义的查询词。
Baidu通过许多方法增强网络的功能。通过简单的方法,它们就能改进网上搜索的准确性,使搜索程序只寻找那些指向精确概念的网页,而不是仅仅通过模糊关键字查到的所有页面。更高级的应用将使用baidu将页面上的信息关联到相关的知识结构和推理规则。
总之,利用Baidu进行相关搜索,使得用户可以由模糊搜索得到比较精确的结果,由一个搜索得到与之相关的其他搜索结果。
|