一、招标条件
秦安县图书馆知识资源细颗粒度建设和标签标引项目,项目已具备招标条件,甘肃安华工程管理咨询有限公司受秦安县图书馆的委托,现对本项目进行公开招标,择优选择承包人。
二、采购内容及预算
1、采购内容:秦安县图书馆知识资源细颗粒度建设和标签标引项目
2、采购预算:14.65万元。
三、采购需求:
利用语义网、知识图谱、大数据、智能计算等技术,开展基础数字资源的细颗粒度内容标识、关键知识点的标签和标引建设,对资源内容进行精细化揭示,实现资源的知识化、专题化服务。
项目名称
技术参数
备注
秦安县图书馆地方文献资源精细化标引
1.地方文献资源做知识细颗粒度精细化标引不少于10000条,项目技术需求以《智慧图书馆知识资源数据建设指南》为标准;
2.属于文献数字资源类:数字资源精细化标引一般以文献组成要素单元为加工单位。对图书资源的封面、前言、目录、正文篇章等每个析出部分作为著录单元;
3.属于族谱数字资源类:数字资源精细化标引一般以文献组成要素单元为加工单位。每个析出部分作为著录单元;
4.成果形式:
元数据,包括音视频基础资源元数据、细粒度加工元数据(包括小节元数据、责任者元数据)、知识抽取数据(人物、机构、事件、地理名称、作品、实物、知识内容片段),一般采用 XML 格式,遵照 XML1.0 规范,使用 UTF-8 编码方式、Unicode5.0 字符集, 信息尽可能完整、正确;
5.知识资源细颗粒度建设数据著录规则
(1)规则概述
对基础的数字资源,如:自有版权的地方特色文献、古籍、公开课、专题片等,进行细颗粒度的内容标识,给出主题词、分类号、关键词等,从而实现资源内容的精细化揭示;对资源的关键知识点进行标签、标引建设,编制相关联的知识元数据,实现资源的知识化、专题化服务。
具体执行参照国家图书馆关于“知识资源细颗粒度建设和标签标引”规则规范。
(2)著录对象
著录对象为公共图书馆自建的各种类型专题数字资源以及其中析出的关键知识,例如:重要的人物、事件、组织机构、地理实体等。
(3)著录粒度
一般以具有独立名称或独立标识的一个信息资源为著录单位,如一种图书、一本期刊、一个事件、一个机构、一个人物等。
(4)数据的内容结构与著录标准
1)资源信息元数据的内容结构
围绕数字资源内容,在不同层级进行细粒度标引,例如:文本类资源的标引细化到三级颗粒,实现篇章级、段落级的标引,给出主题词、 关键词、分类号等;音视频类资源根据资源情况进行颗粒度分级,做关键词、主题词控制的内容标引等。
2)知识元数据的内容结构
同一资源可以基于知识的角度,进行多维度、多层次、全方位的揭示。在资源精细化标引的基础上,捕获相关的人物、事件、组织机构等不同类型的知识点,编制知识元数据,从而对资源进行重新聚类,形成主题化、专题化的分类揭示,实现知识的智能化发现。以下根据知识点的不同类型以人物元数据、事件元数据、组织机构元数据、地理元数据为例进行说明。