• 1.摘要
  • 2.基本信息
  • 3.工作原理
  • 4.相关技术
  • 5.发展现状
  • 6.发展趋势
  • 7.存在问题

图片地址搜索

图片地址搜索的英文名称是Image url Indexing, 有时也翻译为Image url Search.

产生互联网上的图像数据信息日渐庞大,用户对网上图像搜索的要求也在不断增长,使各种基于Web的图像搜索引擎应运而生。图片地址搜索引擎的出现,使我们对网上图像信息的搜索变得非常简单,尽管还不很完美,却已经可以满足我们的大多数需求。

基本信息

  • 中文名

    图片地址搜索

  • 外文名

    Image url Indexing

  • 亦翻译

    Image url Search

  • 趋势

    搜索结果方向性更强

工作原理

WWW图像搜索引擎需要为在Web上浏览过的图像建立索引信息,能够进行图像分析和判别,为图像加注释,存储抽取出的索引信息建立索引库,理想的图像搜索引擎还应该能支持基于内容的图像检索。 图像识别方法:

1、自动查找图形文:可以通过两个HTML标签,即IMG SRC和HREF来检测是否存在可显示的图像文件,IMG SRC表示“显示下面的图像文件”,而HREF则表示“下面是一个链接”,这两种标签经常导向一个图像文件。搜索引擎通过检查文件扩展名来判断链接的是否是图像文件。如果文件扩展名是.GIF或.JPG,那它就是一个可显示的图像。

2、人工干预找出图像并进行分类:由人工对网上的图像及站点进行选择。这种方法可以产生准确的查询体系,但劳动强度太大,限制了处理图像的数量。由于图像不同于文本,需要人们按照各自的理解来说明其蕴含的意义,因此图像检索比起文本的查询和匹配要困难得多。目前的图像搜索引擎大多支持关键词检索和分类浏览两种检索方式,部分可提供可视属性检索,但也很有限。它们主要的检索途径有以下几种:

a. 基于图像外部信息:即根据图像的文件名或目录名、路径名、链路、ALT标签以及图像周围的文本信息等外部信息进行检索,这是目前图像搜索引擎采用最多的方法。在找出图像文件后,图像搜索引擎通过查看文件名或路径名确定文件内容,但这取决于文件名或路径名的描述程度。

b. 基于图像内容特征描述:这是一种语义层次的匹配。需要人工对图像的内容(如物体、背景、构成、颜色特征等)进行描述并分类,给出描述词。检索时,将主要在这些描述词中搜索你的检索词。这种查询方式是比较准确的,一般来讲可以获得较好的查准率。但需人工参与,劳动强度大,因而限制了可处理的图像数量,并且需要一定的规范和标准,效果取决于人工描述的精确度。

c. 基于图像形式特征的抽取:由图像分析软件自动抽取图像的颜色、形状、纹理等特征,建立特征索引库,用户只需将要查找的图像的大致特征描述出来,就可以找出与之具有相近特征的图像。这是一种基于图像特征层次的机械匹配,特别适用于检索目标明确的查询要求(例如对商标的检索)。产生的结果也是最接近用户要求的。但目前这种较成熟的检索技术主要应用于图像数据库的检索,在网上图像搜索引擎中应用这种检索技术还具有一定的困难。

相关技术

从广义上讲,图像的特征包括基于文本的特征(如关键字、注释等)和视觉特征(如颜色、纹理、形状等)两类。视觉特征又可分为通用的视觉特征和领域相关(局部/专用)的视觉特征。前者用于描述所有图像共有的特征,与图像的具体类型或内容无关,主要包括颜色、纹理和形状;后者则建立在对所描述图像内容的某些先验知识(或假设)的基础上,与具体的应用紧密有关,例如人的面部特征或指纹特征等。

1、基于上下文本(context)的图片搜索

通常是通过Alt等锚来索引,搜索的,您可以访问搜索引擎,比如百度、GOOGLE。在搜索框内输入搜索文字,点击右侧的“图片搜索”按纽,即可获得相关图片搜索结果。

2、基于图片内容的搜索

涉及了数据库管理、计算机视觉、图像处理、模式识别、信息检索和认知心理学等诸多学科,其相关技术主要包括:图像数据模型、特征提取方法、索引结构、相似性度量、查询表达模式、检索方法等。相似图片的检测主要涉及特征表示和相似性度量这两类关键技术。图像特征的提取与表达是基于内容的图像处理技术的基础。

发展现状

一类是以百度、GOOGLE、有道等专业搜索引擎网站为代表提供的图像或图片搜索功能。此类搜索引擎搜索面大,搜索结果信息庞大,只能提供较为单一的搜索服务,搜索结果给予用户比较多的选择性。

另一类是以安图搜等专业图像搜索服务为代表的网站,为用户提供除文字外,通过输入图片URL进行搜索服务。此类网站更多的服务应用于网上购物领域的服务方向,更多的是为用户提供在网购方面的体验。

发展趋势

随着百度识图、安图搜等图像搜索网站的出现站,让图像搜索更加趋向于专业性服务,搜索结果方向性更强,精确性更高。

存在问题