• 1.摘要
  • 2.基本信息
  • 3.内容定义
  • 4.区别介绍
  • 5.应用方向
  • 6.技术内容
  • 7.应用领域
  • 8.搜索特点
  • 9.关键词搜索引擎
  • 10.图片特征搜索引擎
  • 11.占有市场
  • 12.相关概念
  • 13.门槛
  • 14.特点
  • 15.引擎站点的八条准则
  • 16.搜索市场细分
  • 17.浅谈垂直搜索引擎
  • 18.从垂直搜索数据中了解用户需求
  • 19.未来发展
  • 20.参考资料

垂直搜索

垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。其特点就是“专、精、深”,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则显得更加专注、具体和深入。

基本信息

  • 中文名

    垂直搜索

  • 类别

    专业搜索引擎

  • 别称

    专业搜索引擎专题搜索引擎

  • 关键技术

    文本挖掘等

内容定义

垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。其特点就是“专、精、深”,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则显得更加专注、具体和深入。

区别介绍

垂直搜索引擎和普通的网页搜索引擎的最大区别是对网页信息进行了结构化信息抽取,也就是将网页的非结构化数据抽取成特定的结构化信息数据,好比网页搜索是以网页为最小单位,基于视觉的网页块分析是以网页块为最小单位,而垂直搜索是以结构化数据为最小单位。然后将这些数据存储到数据库,进行进一步的加工处理,如:去重、分类等,最后分词、索引再以搜索的方式满足用户的需求。整个过程中,数据由非结构化数据抽取成结构化数据,经过深度加工处理后以非结构化的方式和结构化的方式返回给用户。

图片

微软研究院一名技术专家曾经说过:“75%的内容使用搜索引擎搜索不出来”。而垂直搜索引擎的诞生则是为了更大程度地提高搜索的“查全率”和“查准率”。垂直搜索引擎通过对行业领域内的信息模型和用户模型结构化的搜集或再组织,提供更多、更专业、个性化的行业相关服务。

应用方向

垂直搜索引擎的应用方向很多,比如企业库搜索、供求信息搜索引擎、购物搜索、房产搜索、人才搜索、地图搜索、mp3搜索、图片搜索……几乎各行各业各类信息都可以进一步细化成各类的垂直搜索引擎。举个例子来说明会更容易理解,比如购物搜索引擎,整体流程大致如下:抓取网页后,对网页商品信息进行抽取,抽取出商品名称、价格、简介……甚至可以进一步将笔记本简介细分成“品牌、型号、CPU、内存、硬盘、显示屏、……”然后对信息进行清洗、去重、分类、分析比较、数据挖掘,最后通过分词索引提供用户搜索、通过分析挖掘提供市场行情报告。

技术内容

垂直搜索引擎大体上需要以下技术

1.搜索引擎爬虫:抓取互联网上的相关网页

2.网页结构化信息抽取技术或元数据采集技术:从网页中抽取出结构化的数据

3.分词、索引:存储并索引数据

4.数据展现:由于存储的数据并非简单的网页数据,需要考虑根据行业需求进行展示

5.其他信息处理技术

垂直搜索引擎的技术评估应从以下几点来判断

1.全面性

2.更新性

3.准确性