几种搜索引擎的图像搜索功能比较 如今,搜索引擎大大小小已经有十几种了,可谓百家争鸣,互相角逐。 人们最熟知的便是google和百度。百度是中国国内用的最多的搜索引擎,而google则是放眼全球,雄踞搜索引擎全球第一霸主交椅。另外,雅虎,搜狗,新浪,网易,搜狐等也占据着市场的一定份额。今天,我不想泛泛而谈这些搜索引擎的原理和诸多功能,只想抓其图像搜索一点进行比较,同时谈谈自己的一些看法。 一.图像搜索相关知识 图像搜索,是通过搜索图像文本(关键词)或者可视属性,为用户提供网络上上相关图形图像资料检索服务的专业搜索引擎系统,是搜索引擎的一类细分。就是分为两大类: 1.通过输入与图片名称或内容相似的关键字来进行检索; 2.通过上传与搜索结果相似的图片或图片URL进行搜索。 现在网络上的图像也是呈爆炸性增长,每条新闻基本都会配上相应的图片,由此人们对于图像搜索的要求也在不断增加,所以更大引擎公司便早早地开发了图像搜索功能并不断完善。目前,大多数的图像搜索引擎都支持关键字的检索,部分能支持图像的视觉特征检索,但是视觉特征检索还有待提升。 二.三大门户的图像搜索比较 1. 用户界面的比较 大家对百度清爽的界面一定很有感触,百度的界面相当简洁实用,在百度首页,点击“图片”链接,就出来了图片搜索界面,点选框内有“新闻图片”,“全部图片”,“壁纸”,“表情”,“头像”,默认的是“全部图片”,在这下面还有“热点目录”,“特别专题”,“百度识图”等选项。简单但是实用。 Google的图片界面显得更为简洁,连广告都没有,搜索框下面是图片分类:潮流女星,精美壁纸,滑稽,生活时尚,闪亮男星。下面还有就是:加入营销计划,Google大全。仅此而已,看的相当清凉啊。 而YaHoo的图片搜索界面与前两者相比就略显复杂了,搜索框下有分类检索,包括“壁纸大全”,“聊天头像”,“明星串烧”等9项内容。旁边是“别人正在搜”,都是一些近期比较流行的词条。最下面是“今日热点推荐”,12副图片也都是近期人气比较旺的新闻。虽然界面显得更为复杂,但是雅虎把一些热门流行的图片信息显示出来,更易于读者直观的搜索。 总的说来,三大搜索门户的图片首页做的都很简约,雅虎会相对复杂点,但也让人一目了然,而且提供了较多的信息。 2.高级检索 百度的图片高级检索里有:搜索结果(也就是输入关键字),图片格式(jpg,gif,bmp,png),站内图片(在指定的网站中搜索)。还有个个性设置。功能分类简洁明了。 Google的图片高级选项中东西分的就更细致了,除了百度有的功能外,它的搜索结果分为:必须和下列的全部字词有关,必须和下列的字句有关,只要和下列的任何一个字句有关,和下列字句无关。还有图片尺寸的选择:大尺寸,中尺寸,图标,以及多少像素,几百乘几百的图片,分的很细。还有就是图片的颜色:黑白或者彩色。 Yahoo居然没有高级选项,这点是它需要改进的地方。 3.检索性能的比较 性能主要包括检索的数量,用时,精准度,我们来分别比较下。 我们拿“罗斯”,“拉登”,“故宫失窃”,“让子弹飞”,“奥迪”,“linux”等六个关键字分别进行检索。 表1 检索数量(单位:张) 德里克罗斯 本拉登 故宫失窃 让子弹飞 奥迪 百度 468,000 21,000 988 Google 196,000 298,000 133,000 Yahoo 119 1,632 7 20,600 2,180,000 20,576 22,300.000 105,000,000 377,109 表3 准确率(前100张) Yahoo 40 36 3(共7个) 96 97 98 Linux 3,470,000 61,500,000 161,973 表2 检索用时(单位:秒) 百度 Google Yahoo 德里克罗斯 0.013 没显示 0.018 本拉登 故宫失窃 让子弹飞 奥迪 Linux 0.022 没显示 0.07 0.008 没显示 0.063 0.014 没显示 0.446 0.037 没显示 0.593 0.024 没显示 0.234 百度 Google 德里克罗斯 89 98 本拉登 故宫失窃 让子弹飞 奥迪 Linux 92 96 95 98 99 95 99 98 100 100 从上面三个表格可以看出,google的搜索量整体来说是最大的,百度次之,但搜索量也很大,yahoo和前二者相比,则差了一个档次,像“故宫失窃”,仅搜出7个结果;从时间方面,百度搜索速度较雅虎快一个等级,虽然google没有显示时间,但实际上1秒不到的时间对于用户来说无关紧要;从准确率来看,google的准确率是最高的,百度稍逊之,雅虎最差,而且雅虎搜索一些人物或者影响力不是那么大的事件时,准确率都很低。 我们可以看出,google和百度还是不相上下的,搜索结果都能令用户满意,而yahoo的图像搜索实在是有愧它的第三门户称号,这方面需要大力改进。 三.Google和百度“以图识图”功能 百度近期出了一个“百度识图”,只要上传本地图片或者输入URL地址,它便会自动进行搜索,只是要求文件的大小要小于5M,基本上图片都打不到5M,我试了几张网上的图片,效果不错,不足之处就是显示的图片就只是网上的原图,比如我输入“科比”的一张图片,出来的结果都只是那张图片相关的网页,其他科比的图片就一张也搜索不到。 而google去年推出的Google Goggles,它对用户上传的图片内容进行分析,可以辨认书籍,绘画,场所和企业图标等等,用户可以对着景物拍照,然后把拍到的照片传上去进行网络搜索,比如上传一张故宫的照片,系统便会向你的手机反馈它的资料,不过google公司仍在试验这项技术,以求做的更完善更精确。 四.其他一些图像搜索引擎 1.Picsearch是个专业的图像搜索引擎,它不提供文本检索,只提供图像检索服务,Picsearch还是一个图片搜索服务供应商,MSN和LYCOS就是其中的客户。打开它的首页,同样地简约明了,必要的搜索框下面是最热门关键字的图片,和yahoo有点像,不过我试了下,搜索效果不是很好,比yahoo的还差一些。 2.新浪图片搜索是全球第一个数码图像搜索引擎,是面向华人的网上资源查询系统。搜 索图像的效果也是比较一般,不过比Picsearch要好。 Lycos是搜索引擎中的元老,是最早提供信息搜索服务的网站之一,以下就是它搜索界面: 虽然是英文的,同样是很简单易操作,搜索结果也不错。 3.HotBot是美国一个优秀的搜索引擎,最大的特点在于它的界面组织和丰富的检索功能。它除了能够检索WEB页面之外,还提供域名检索、新闻搜索、新闻讨论组等等检索服务。HotBot在页面上提供了直观的图形化检索菜单功能,用户可以通过简单的下拉菜单创建复杂的布尔查询,或者按日期、地理区域和媒体类型进行限制性搜索。 4.EXCITE搜索引擎是ARCHITEXT公司的产品,其数据库界面非常友好,用户可以利用关键词、词组和自然语言进行检索。由于它已经开发出包括中国的多种全球区域版本,为特定地区提供高效率的服务,因此它也是使用最为广泛的搜索引擎之一。它的首页内容很丰富,以下是它的搜索界面 不支持中文,只能输入英文查询。图像搜索效果一般。 五.总结 综合比较了诸多的搜索引擎,发现google和百度的确是出类拔萃,其他搜索引擎难以望其项背,而且界面的简洁是一个搜索引擎应该具备的特点,让用户在心里上就感到舒服,图像的搜索目前还是文本搜索地占据了绝大部分,“以图识图”功能目前还做得差强人意,但是它的前景是很广阔的,相信随着技术的发展,用不了几年,用图像来搜索图像的技术会令用户叹为观止,这也是大多数用户的期盼。 信息检索这门课的确让我学到了不少东西,至少在使用搜索工具上让我有了很大的提高,以前只是用百度和google搜索些很基本的网页,学完这门课,才发现搜索的世界是这么奇妙,有好多东西都没挖掘出来,应该充分发挥这些引擎工具,辅助自己学习的同时,也能从中学到很多知识。 本文来源:https://www.wddqw.com/doc/78719f08844769eae009eda2.html