由于移动互联网、电子商务、社交媒体的快速发展,出版社面临的数据呈现指数级增长变化,数据量的飞速增长带来了大数据技术和服务市场的繁荣发展。专业出版社作为知识内容和数据资源的提供者,在互联网、大数据环境下,能够为终端用户提供怎样的服务,是现在出版社思考的问题。
NLPIR大数据知识服务平台是灵玖软件针对大数据垂直搜索需求的全文智能检索引擎,融合了自然语言理解、网络搜索和文本挖掘的技术,通过人机互动、深度机器学习后具有一定的语义推理能力,是结合了人工智能技术的新一代搜索引擎。
NLPIR大数据知识服务平台主要满足知识搜索、统计分析、语义技术、语义本体五大功能模块。以下介绍具体功能:
一、知识搜索
搜索引擎给出语义深度理解的功能外,还兼具图书文献类知识管理搜索功能,搜索框输入你要查询的关键词,搜索引擎通过人机互动、自然语言理解,对你输入的内容进行相关图书文献搜索,对搜索结果进行去重并推送精准结果。如搜索“智能电网”,直接展示出与关键词“智能电网”有关的文献和图书,目前系统内已经收录了数千部文献和图书,可以充分的满足搜索需求。
二、 统计分析
搜索引擎不仅有知识管理及搜索功能,还能在后台进行统计分析,直接展示出分析结果,如,搜索“智能电网”后“国网报信息来源地图“中的展示,由颜色深浅表示文章的相关来源城市出现的次数高低,蓝色约深表示相关文章来源城市出现频次高。
三、语义技术
语义技术部分展现的是后台的语义处理技术,包括概念发现、关联关系的建立和基于机器学习的关系计算,最红利用完善的本体库,进行语义计算。
四、语义本体功能
语义精准搜索引擎通过实体抽取功能,在数据库中搜索挖掘出其中实体,规定各实体之间的关系类别,通过交叉信息熵计算每个实体的关联关系,从而建立整理的实体关系展示图谱。搜索引擎抽取出行业的实体概念,通过规定核心概念、用项、代项、分项、属项、族项、参项这六项关系,采用一定算法建立实体之间的关系,从而建立整个实体的关系关联展示图。