一 怎样从脏乱差的医疗大数据中提取价值( 二 )


四、医疗大数据的现状1. 数据异构多平台,多种接口,数据类型没有一个标准,只能是点对点的对接大量数据,内容冗杂、过程繁复、速度缓慢 。
2. 主题分散性就诊信息分布在不同的平台上,不能够形成以患者为中心的所有电子化就诊信息集成,不能提供完整、全面、准确、及时的患者临床信息 。
3. 数据量大在大数据背景下,行业应用的数据量通常都以亿级别计算,存储通常在TB/PB级别甚至更多 。
4. 数据多态数据模型在数据出现之后才能确定,数据模型随着数据量增长不断演变 。
五、建立医疗大数据资产目录依据卫生部信息化工作领导小组办公室卫生部统计信息中心2011年3月发布的《基于电子病历的医院信息平台建设技术解决方案——业务部分》所示:
1. 临床服务域包含12个二级类目:患者标识、患者服务、入出转、医嘱、病历文书、护理文书、检验、检查、手术麻醉、治疗、输血、健康体检,业务子域共计26个 。
2. 医院管理域包含4个二级类目:医疗管理、人力资源管理、财务管理、物资及后勤服务管理 。共有业务子域共26个 。
3. 平台应用域包含5个二级类目:区域医疗协同、管理决策、临床决策、公共卫生信息上报、患者公众服务 。共有业务子域20个 。
根据临床服务、医院管理、平台应用三域,梳理建设以业务活动为核心的数据资产目录,根据业务活动主题梳理数据元标识符,保证每一个数据元的标识符具有唯一性(基本数据集:城乡居民健康档案、疾病管理、医疗服务、电子病历等) 。
1)数据元标识符“DE08.10.052.00”来源依据《TCHIA 7.3-2018 高血压专科电子病历数据集 第3部分:高血压门(急)诊处方》
2)数据允许值“WS218–2002”来源依据《WS 218-2002 卫生机构(组织)分类与代码》
六、从业务系统中抽取数据关联映射业务系统表字段,并创建调度任务,如图五:
映射多表情况下,需要选择关联表主外键字段,如图六:
调度任务可支持针对单表、全表,历史数据抽取,实时数据监听抽取俩种模式,如果图七:
七、数据质量质控具有对数据质量进行评估的完整的指标体系,至少应该有完整性(事件、表单、记录、表项)、一致性(主数据一致性、逻辑一致性)、唯一性(无二义冗余、指标及计算口径)、及时性、原始性、可溯源性及可测量性 。
八、数据中台建设根据数据资产目录快速定位业务主题,如图八:
根据不同业务场景,自定义勾选数据元名称,自动生成API或新的主题库(数据集市) 。


以上关于本文的内容,仅作参考!温馨提示:如遇健康、疾病相关的问题,请您及时就医或请专业人士给予相关指导!

「四川龙网」www.sichuanlong.com小编还为您精选了以下内容,希望对您有所帮助: