项目的总体设计
(一)项目的建设原则
健康医疗建设是一项长期的系统性工程,为确保健康项目建设符合信息化发展基本规律,推进科学有序,各智慧应用形成统一整体,达成健康建设的各项预期,需遵循以下基本原则与策略。
1.坚持统筹规划,重点推进。统筹考虑卫计局、县属医院、社区卫生服务中心等医共体建设,进行符合我区实际情况开展顶层设计和总体规划,形成统一、规范的信息系统支撑。将“互联网+健康医疗”惠民信息系统率先建设,推进信息技术的广泛应用。
2.坚持区域共享,深化应用。持续深化条线业务应用,重点强化医医、医卫、医管、医保、医药、医患等六大信息化业务协同。整合全区各医疗机构电子健康档案、电子病历、签约服务、公共卫生等区域性服务应用系统,建立以人为中心的医卫信息共享机制;打造医共体内的医疗共享平台,推进医共体信息化支撑建设,优化医疗资源配置,提升医疗服务效率,体现服务公平可及。
(二)项目的总体架构和技术路线
1.总体架构
以一体平台、智数双驱、全面健康为医共体助力,通过部署数据中台,实现对医共体范围内的医疗卫生信息化资源最大程度应用,通过对涵盖公卫、临床、疾病、母婴、健康、就医主体、医疗资源等全生命周期医疗卫生服务数据的一体化、全景化认知和学习,向新技术、智能化要生产力,赋能医疗卫生服务;挖掘居民医疗服务需求、医疗健康产业运行和临床疾病诊疗等各个领域的潜在规律和态势,推进面向大卫生大健康的创新医疗服务体系不断完善。项目致力于数据的高效集成、深度融合,大力推进各类医疗健康服务行为数据化和数据的真正可用,为健康长期发展打下坚实基础。同时紧紧围绕近民、便民、惠民的目标,以数据为驱动、智能化手段为辅助,推动医共体医疗服务监管、医疗服务组织管理的全面升级,在全面数据支持下,开展智能创新驱动下的最多跑一次和互联网医院服务,紧贴居民需求、建立可衡量、可跟踪、智能感知、科学统筹的高效行动体系,保障各类医疗惠民举措能够抓到要处、谋到深处、落到实处。
2.支撑技术
(1)知识库服务
医疗大数据应用不仅是简单的数据统计分析应用,它还涉及医学基础知识、规则知识的表达,乃至对医学自然语言的机器理解。医学基础知识,如医学术语、诊断代码、手术及治疗代码等,需要采用ICD-10、ICD-9-CM以及SNOMED-CT等标准建立医学本体知识库,如药品研究和健康服务分别需要建立药学研究规则知识库和健康服务知识库。
大数据知识库除了医学本体知识库外,还需要建立经验知识库,通过自动训练使知识库能够从大量的数据中获取更多的知识,并填充到知识库中,即平台需要有自学习的能力。如采用自动训练方法从病历中学习诊断和症状的关系,学习诊断和用药的关系等,为人工智能的应用提供基础。
下面以术语学习为例说明自学习的方法论,采用自动训练方法从大量的病历中学习医生的常用术语表达,并将学习到的内容加入到语料库,使语料库能够自我学习、自动更新、不断丰富,从而未为病历分析提供更加强大语料库的支持。海量病历为自动训练方法的应用提供了有利的基础。在自动训练的方法实施前,平台首先对病历的描述和表达进行分析,病历中存在着大量的词对,如“神志——清楚”“营养——中等”“精神——良好”。平台对从海量病历中抽取出词对,对这些词对的描述出现频率进行自动排序,由人工审核后加入语料库。在此过程中需要识别哪些是同义词描述,如“神志清”和“神志清楚”往往是同一意思,由人工进行同义词标注后加入语料库。对于一些出现频率比较低的描述一般是由于医生书写不规范或笔误造成,也需要由人工审核排除,最终生成一个学习后的、符合医生日常描述习惯的、规范的语料库。
(2)大数据建模服务
健康医疗大数据应用的基础是建立大数据的数据建模,这不仅是健康医疗大数据统计分析的基础,也是医疗大数据知识表达的基础。由于医疗数据的特征是医疗数据之间的逻辑关系和推理规则关系,因此对医疗数据描述的合理架构是树形结构,采用XML语言描述,需要建立以电子病历数据集标准、电子病历共享文档规范为基础的医疗大数据应用数据对象集合结构框架(schema)。
建立各类大数据应用分析schema。在对病历数据进行结构化基础上,研究电子病历数据集标准、电子病历共享文档规范与各类应用研究schema之间的对应关系,建立研究分析数据的逻辑模型和物理模型,通过对区级平台的大数据抽取建立研究数据库。
构建数据分析模型的步骤:
(3)分布式存储服务
虽然已经建立电子病历资源库和健康档案资源库,但是如果要对这些海量数据进行有效的分析,还是应该将这些数据按照分析要求导入到一个集中的大型分布式数据库或者分布式存储集群。
存储数据库(In-Memory Databases)让信息快速流通,大数据分析经常会用到存储数据库来快速处理大量记录的数据流通。
传统的关系型数据库严格的设计定式、为保证强一致性而放弃性能、可扩展性差等问题在大数据分析中被逐渐暴露,随之而来NoSQL数据存储模型开始风行。NoSQL并不是一种特定的数据存储模型,它是一类非关系型数据库的统称。其特点是:没有固定的数据表模式、可以分布式和水平扩展。NoSQL并不是单纯的反对关系型数据库,而是针对其缺点的一种补充和扩展。典型的NoSQL数据存储模型有文档存储、键-值存储、图存储、对象数据库、列存储等。
NoSQL数据库是一种建立在云平台的新型数据处理模式,NoSQL在很多情况下又叫做云数据库。在处理海量数据同时请求时,它也不会有任何问题,例如有1000万人同时登录某个系统,它会将这些数据分布于全世界的服务器并通过它们来进行数据处理,结果与1万人同时在线没什么两样。
(4)分布式计算技术服务
大数据处理与分析主要利用分布式数据库,或者分布式计算集群来对存储于其内的海量数据进行普通的分析和分类汇总等。
分布式计算结合了NoSQL与实时分析技术,如果想要同时处理实时分析与NoSQL数据功能,那么你就需要分布式计算技术。分布式技术结合了一系列技术,可以对海量数据进行实时分析。更重要的是,它所使用的硬件非常便宜,因而让这种技术的普及变成可能。
(5)大数据挖掘分析服务
改进已有数据挖掘和机器学习技术;开发数据网络挖掘、特异群组挖掘、图挖掘等新型数据挖掘技术;突破基于对象的数据连接、相似性连接等大数据融合技术;突破用户兴趣分析、网络行为分析、情感语义分析等面向领域的大数据挖掘技术。
数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。图像化是将机器语言翻译给人看,而数据挖掘就是机器的母语。分割、集群、孤立点分析还有各种各样五花八门的算法让我们精炼数据,挖掘价值。这些算法一定要能够应付大数据的量,同时还具有很高的处理速度。
数据挖掘涉及的技术方法很多,有多种分类法。根据挖掘任务可分为分类或预测模型发现、数据总结、聚类、关联规则发现、序列模式发现、依赖关系或依赖模型发现、异常和趋势发现等等;根据挖掘方法分,可粗分为:机器学习方法、统计方法、神经网络方法和数据库方法。机器学习中,可细分为:归纳学习方法(决策树、规则归纳等)、基于范例学习、遗传算法等。统计方法中,可细分为:回归分析(多元回归、自回归等)、判别分析(贝叶斯判别、费歇尔判别、非参数判别等)、聚类分析(系统聚类、动态聚类等)、探索性分析(主元分析法、相关分析法等)等。神经网络方法中,可细分为:前向神经网络(BP算法等)、自组织神经网络(自组织特征映射、竞争学习等)等。
(6)可视化技术服务
可视化技术是商业智能技术的核心之一,是数据仓库和数据挖掘结果的应用效果展现。数据可视化无论对于普通用户或是数据分析专家,都是最基本的功能。数据图像化可以让数据自己说话,让用户直观的感受到结果。
数据可视化,是关于数据视觉表现形式的科学技术研究。数据可视化可以让数据自己说话,让用户直观的感受到结果。其中,这种数据的视觉表现形式被定义为,一种以某种概要形式抽提出来的信息,包括相应信息单位的各种属性和变量。它是一个处于不断演变之中的概念,其边界在不断地扩大。主要指的是技术上较为高级的技术方法,而这些技术方法允许利用图形、图像处理、计算机视觉以及用户界面,通过表达、建模以及对立体、表面、属性以及动画的显示,对数据加以可视化解释。与立体建模之类的特殊技术方法相比,数据可视化所涵盖的技术方法要广泛得多。
数据可视化技术包含以下几个基本概念:
a)数据空间:是由n维属性和m个元素组成的数据集所构成的多维信息空间;
b)数据开发:是指利用一定的算法和工具对数据进行定量的推演和计算;
c)数据分析:指对多维数据进行切片、块、旋转等动作剖析数据,从而能多角度多侧面观察数据;
d)数据可视化:是指将大型数据集中的数据以图形图像形式表示,并利用数据分析和开发工具发现其中未知信息的处理过程。
数据可视化已经提出了许多方法,这些方法根据其可视化的原理不同可以划分为基于几何的技术、面向像素技术、基于图标的技术、基于层次的技术、基于图像的技术和分布式技术等等。
(7)预测分析服务
数据挖掘可以让分析师对数据承载信息更快更好地消化理解,进而提升判断的准确性,而预测性分析可以让分析师根据图像化分析和数据挖掘的结果做出一些前瞻性判断。
(三)标准规范建设内容
1.总体标准
总体标准主要用以明确系统建设的技术参考模型,其意义在于保证系统的当前建设和以后的建设具有一致性、开放性和稳定性。内容包括总体框架、术语标准、中文信息处理标准、其他综合性标准等。
本系统的建设是一个长期的过程,这是由各行政机构不断增长的业务需求决定的。在这个长期的建设过程中新的业务模块将需要被集成到整个系统中,如何保证本系统的建设保持在一个可控的范围内,系统的技术参考模型将为此提供体系结构上的保证,只有当本系统技术参考模型建立在一个开放的技术体系上,才能够使新的系统方便的集成到本系统整体架构中,并且保持与整个系统的一致性。一个合理的、可行的技术参考模型必须具有很强的稳定性,这是整个本系统能够可持续发展的必要条件。
本系统需要充分地考虑现有内外部系统的实际情况,并考虑系统以后继续建设和扩展的需要,制定统一的、标准的、可操作的信息管理标准规范,作为系统各个信息组成部分建设的依据,可以维持本系统信息整合核心框架的一致性,保证系统的整体运行效果和应用目标。
2.应用规范
应用规范主要对项目建设中的基本内容提出规定,用以统一工程的基础建设。对于应用规范的确立,通常包含的内容有:数据类标准、服务类标准、系统功能规范、业务流程与工作制度规范、数据采集与交换规范。
4.管理规范
管理规范确定了应用系统在建设、运营阶段的各种要求、制度等。管理标准涉及的范围也是非常广泛,例如:软件工程过程标准、验收与监理标准、系统测试与评估体系标准等。
下载完整方案,转发+点赞+评论,私信获取方案。
文章引用的资料均通过互联网等公开渠道合法获取,仅作为行业交流和学习使用,并无任何商业目的。其版权归原资料作者或出版社所有,作者不对所涉及的版权问题承担任何法律责任。若版权方、出版社认为本文章侵权,请立即通知作者删除。