Page 21 - 网络电信2019年3月刊上
P. 21

运 营 商 专 栏

            的语义搜索,这样,电子档案数据的检索与查询不再依靠关键                              四、电子档案数据在关联可视化中的运用
            字而是依靠关系图进行推理查询。                                          联通企业档案知识图谱采取层次图的节点链式可视化展
                                                                 示,在这个过程中,首先基于上述算法及过程进行聚类分析运
                三、联通电子档案数据挖掘与智能利用总体                              算,形成一个一个具有“业务主题”信息的层次聚类节点,用
            设计                                                   户可以跟进偏好设定打开感兴趣的聚类节点。这个聚类节点可
                联通企业电子档案“两库两平台”其核心就是基于现有数                        以是一个单独的视窗,展示聚类层次浏览过程中形成的层次
            字档案馆构建海量数据智能分析与挖掘平台,搭建档案数据分                          树,层次树的节点由标识聚类、子图节点的标签组成。通过层
            析、数据挖掘和三维虚拟现实管理档案综合分析系统,总体建                          次树的展示,帮助用户对整个分析过程有一个实时的、整体上
            设思路如图3所示。
                                                                 的掌握,可以按其需求快速定位任意一个层次节点并在这些层
                                                                 次子图之间进行平滑切换。另外我们还提供了鱼眼放大功能,
             图 3 联通电子档案数据挖掘与智能利用建设总体思路
                                                                 支持用户对某些关联关系密集的区域进行局部放大展示。这些
                                                                 交互性可视化功能的提供,可以保证用户对整个联通电子档案
                                                                 的知识图谱有一个清晰的掌控,同时又能获知局部子图的节点
                                                                 分布及信息情况。联通档案数据知识图谱可视化展示如图5所
                                                                 示。


                                                                  图 5 联通档案数据知识图谱可视化展示








                基于大数据技术,汇聚、存储和处理海量电子档案资源;
            使用数据仓库、数据挖掘的相关技术对档案数据进行处理;基
            于元数据和本体技术,以及机器学习的相关算法,在更高层次
            (知识层)对数据提供进一步的分析和挖掘。通过数据关联可
            视化等技术,支持电子档案数据的可视化展示,在展示档案自
            身信息内容的同时,进一步展示档案之间的关联关系。“两库
            两平台”模式的档案智能利用中心在深入分析、挖掘档案馆的
            信息的同时,为档案资源实现有效管理提供了有力保障,也为                              通过语义网、机器学习、数据关联可视化等技术构建的联
            档案利用的积极开展提供了有力支持。                                    通电子档案知识图谱系统,能够将档案数据之间的关联关系、
                基于现有电子档案馆构建海量数据智能分析与挖掘平台,                        分析结果直观展示,进而有效地展现企业电子档案价值,为电
            搭建档案数据分析、数据挖掘和三维虚拟现实管理档案综合分                          子档案的智能化管理以及辅助企业决策提供有力支撑。
            析系统,系统架构如图4所示。

             图 4 联通电子档案管理平台系统架构图                                     五、结论
                                                                     电子档案数据的深度挖掘是大数据时代的主要特点,档
                                                                 案学的发展历程中,每一次重大的技术变革都必然影响着档案
                                                                 应用的发展。大数据技术发展,对联通电子档案数据资源有效
                                                                 管理,为实现档案管理流程由粗放走向精细化提供了可能。本
                                                                 文提出构建“两库两平台”智能利用中心,引入语义网、数据
                                                                 挖掘等技术,有效对电子档案资源进行科学的分类、挖掘和分
                                                                 析,提升档案利用效率和服务水平,在为企业实现业务有效管
                                                                 理提供有力保障的同时,也高效、准确地为联通企业决策提供
                                                                 强有力的数据支持。









            20                                         网络电信 二零一九年三月
   16   17   18   19   20   21   22   23   24   25   26