Page 21 - 网络电信2019年3月刊上
P. 21
运 营 商 专 栏
的语义搜索,这样,电子档案数据的检索与查询不再依靠关键 四、电子档案数据在关联可视化中的运用
字而是依靠关系图进行推理查询。 联通企业档案知识图谱采取层次图的节点链式可视化展
示,在这个过程中,首先基于上述算法及过程进行聚类分析运
三、联通电子档案数据挖掘与智能利用总体 算,形成一个一个具有“业务主题”信息的层次聚类节点,用
设计 户可以跟进偏好设定打开感兴趣的聚类节点。这个聚类节点可
联通企业电子档案“两库两平台”其核心就是基于现有数 以是一个单独的视窗,展示聚类层次浏览过程中形成的层次
字档案馆构建海量数据智能分析与挖掘平台,搭建档案数据分 树,层次树的节点由标识聚类、子图节点的标签组成。通过层
析、数据挖掘和三维虚拟现实管理档案综合分析系统,总体建 次树的展示,帮助用户对整个分析过程有一个实时的、整体上
设思路如图3所示。
的掌握,可以按其需求快速定位任意一个层次节点并在这些层
次子图之间进行平滑切换。另外我们还提供了鱼眼放大功能,
图 3 联通电子档案数据挖掘与智能利用建设总体思路
支持用户对某些关联关系密集的区域进行局部放大展示。这些
交互性可视化功能的提供,可以保证用户对整个联通电子档案
的知识图谱有一个清晰的掌控,同时又能获知局部子图的节点
分布及信息情况。联通档案数据知识图谱可视化展示如图5所
示。
图 5 联通档案数据知识图谱可视化展示
基于大数据技术,汇聚、存储和处理海量电子档案资源;
使用数据仓库、数据挖掘的相关技术对档案数据进行处理;基
于元数据和本体技术,以及机器学习的相关算法,在更高层次
(知识层)对数据提供进一步的分析和挖掘。通过数据关联可
视化等技术,支持电子档案数据的可视化展示,在展示档案自
身信息内容的同时,进一步展示档案之间的关联关系。“两库
两平台”模式的档案智能利用中心在深入分析、挖掘档案馆的
信息的同时,为档案资源实现有效管理提供了有力保障,也为 通过语义网、机器学习、数据关联可视化等技术构建的联
档案利用的积极开展提供了有力支持。 通电子档案知识图谱系统,能够将档案数据之间的关联关系、
基于现有电子档案馆构建海量数据智能分析与挖掘平台, 分析结果直观展示,进而有效地展现企业电子档案价值,为电
搭建档案数据分析、数据挖掘和三维虚拟现实管理档案综合分 子档案的智能化管理以及辅助企业决策提供有力支撑。
析系统,系统架构如图4所示。
图 4 联通电子档案管理平台系统架构图 五、结论
电子档案数据的深度挖掘是大数据时代的主要特点,档
案学的发展历程中,每一次重大的技术变革都必然影响着档案
应用的发展。大数据技术发展,对联通电子档案数据资源有效
管理,为实现档案管理流程由粗放走向精细化提供了可能。本
文提出构建“两库两平台”智能利用中心,引入语义网、数据
挖掘等技术,有效对电子档案资源进行科学的分类、挖掘和分
析,提升档案利用效率和服务水平,在为企业实现业务有效管
理提供有力保障的同时,也高效、准确地为联通企业决策提供
强有力的数据支持。
20 网络电信 二零一九年三月