kbase
清华同方KBase全文数据库管理系统(简称KBase)是以管理海量的文本、网页、档案、文献、办公文档等非结构化数据为主,具备中文智能信息处理能力的国产数据库管理系统。KBase具有优异的全文检索性能和强大的海量非结构化数据存储管理能力,拥有超过500万词汇量的、大百科式的概念关系词典,具备业界领先的中文智能信息处理能力。
主要特点
高效、准确的全文检索
KBase全文检索速度高达500G/S,处于业界领先地位。同时,KBase基于先进的高维索引技术在国际上首次将相似检索功能真正做到了实用化水平: 速度高达百万级文献量毫秒级响应。
KBase集成先进的全切分切词算法,很好地解决了歧义切分问题,可将“原子结合成分子”正确地切分成“原子/结合/成/分子”而不是“原子/结合/成分/子”,从而使KBase与同类产品相比具有更高的 查准率、 查全率。
海量非结构化数据管理
KBase具有强大的海量非结构化数据存储管理能力,单表管理的记录数可达40亿,单表管理的数据容量可达TB级( 分区表可达PB级)。KBase 同时支持多机群集,实现数据的分布式存储。KBase作为 CNKI工程的运营支撑平台,目前管理着全球最大的中文知识 信息资源数据库,每天提供千万人次的 信息检索服务,其优异的性能和稳定性,受到广大CNKI用户的广泛赞誉。
功能强大的 关系数据库全文检索网关
KBase提供了对Oracle、DB2、SQL Server、Sybase、Informix等主流 关系数据库管理系统(统称RDBMS)的全文检索网关,实现了RDBMS和KBase 服务器之间的 数据共享和实时同步,使用户在享有RDBMS卓越的数据处理功能的同时,拥有KBase优秀的全文检索功能。基于KBase 关系数据库全文检索网关,可以整合多种异构 数据源,实现企业级信息资源的统一搜索。
大规模并发处理能力
KBase支持多 服务器群集,可将多个独立的KBase服务器虚拟整合成一个整体,实现高效的 分布式计算,大大提高系统的并发处理能力。
先进的中文智能信息处理能力
KBase拥有超过500万词汇量的、大百科式的概念关系词典,集成Smart TextMiner 文本挖掘引擎和NLP 自然语言处理引擎,可提供 自动分类、 自动聚类、关键词 自动标引、 自动文摘、信息过滤、 关联规则挖掘等多种实用功能。
易用的检索语言
KBase充分考虑用户使用习惯,提供类似SQL的查询语言—KSQL,设计更加人性化。
完整的应用开发接口
KBase提供.Net组件、COM组件、Java组件、ODBC、ADO等数据库访问接口,并且针对有较高 底层开发要求的用户提供完整的 二次开发接口。KBase 同时支持Z39.50、OAI、OpenURL等访问接口。
支持多种编码
KBase提供对 GB2312、BIG5、GBK、GK18030、UNICODE等多种编码的直接支持。