给我们留言
91学术服务平台

您好,欢迎来到91学术官网!业务合作:91xueshu@sina.com,站长邮箱:91xszz@sina.com

发布论文

论文咨询

健康医疗大数据分类分级及安全策略

  2024-12-03    22  上传者:管理员

摘要:随着医院信息化建设水平不断提高,人工智能、5G和物联网技术方兴未艾,互联互通成熟度水平不断提升,健康医疗大数据利用与共享日益频繁,医疗机构面临的网络攻击和数据安全风险日益加大,我们在享受大数据利用带来的便利和成果的同时,如何切实保障医院大数据安全是医院高质量发展面临的重要课题。健康医疗大数据的数据安全治理首先要做的就是对数据进行分类分级,按照数据分类分级制定差异化的数据安全防护策略,本文通过对我院健康医疗大数据分类分级和安全防护策略研究,并结合实践应用,为确定科学、合理、合法的健康医疗大数据分类分级规则、安全防护策略提供思路。

  • 关键词:
  • 健康医疗
  • 分类分级
  • 医疗信息化
  • 大数据
  • 安全策略
  • 加入收藏

随着医疗信息化系统的广泛应用,互联互通成熟度水平不断提高,健康医疗大数据利用与共享日益频繁,数据已成为医院等医疗机构发展的重要资产。医疗行业关系国计民生,医疗数据一旦遭到篡改、破坏或泄露,势必对医院等医疗机构的正常运转及医患双方的隐私安全构成严重威胁,甚至影响社会的安定和谐。我们在享受大数据利用带来的便利和成果的同时如何切实保障医院大数据安全是医院高质量发展面临的重要课题。健康医疗大数据的数据安全治理首先要做的就是对数据进行分类分级,按照数据分类分级制定差异化的数据安全防护策略。目前,国家卫健委已经发布了数据分类分级标准指南,面向全体行业,具有一定的参考价值。但是标准范围广、粒度粗,各级医疗机构细分领域多,我们在数据分类分级时也只能参考部分。另一方面健康医疗大数据具有数据量大、复杂、多源异构等特征,涉及业务及其数据存储环境众多,我们需要根据自身特点研究符合自己单位实际情况可操作的标准和规范。


1、健康医疗大数据的特征


海量性(数据规模巨大):医疗领域产生的数据量庞大,涉及大量患者的临床信息、医学影像、实验室结果等,这种海量性要求采用大数据处理和分析技术来有效地存储、管理和分析这些数据;多源性(数据来源多样):健康医疗大数据来自各种不同的源头,包括医院信息系统、电子病历、实验室结果、影像学数据、生命体征监测等,这些数据来源的多样性增加了数据的复杂性;多样性(数据类型多样):医疗大数据包含结构化数据(例如数据库中的表数据)、半结构化数据(例如XML格式的文档)、非结构化数据(例如语音、图像、音频等),这些不同类型的数据需要采用多样的处理和分析方法;实时性(数据处理的实时性):医疗决策通常需要实时或接近实时的数据支持,例如,实时监测患者的生命体征、实时预警系统等需要对数据进行快速处理和分析;复杂性(数据关联和挖掘的复杂性):医疗数据中存在复杂的关联关系,例如患者的病历信息、实验室结果、医学影像之间的关系,挖掘这些复杂关系需要使用先进的数据挖掘和分析技术;隐私性和安全性(敏感信息的安全防护):医疗数据涉及患者的敏感信息,如个人身体状况、诊断、治疗记录等,因此,确保医疗大数据的隐私性和安全性是一个重要的特征,需要遵守相关法律法规和标准;标准化(数据格式和交换标准):为了实现不同系统和机构之间的数据共享和互联互通,医疗大数据需要采用统一的标准,例如卫生信息交换标准(HL7)、医学数据元标准体系(CDA);个性化(针对个体的定制化分析和治疗):医疗大数据的分析和应用往往是面向个体的,以实现个性化医疗服务,根据患者的特定情况制定个性化的治疗方案。


2、分类分级


要对这些海量复杂的健康医疗大数据进行安全治理,首先要对这些数据资产进行梳理并分类分级,根据分类分级结果制定不同的安全防护策略,健康医疗大数据分类分级过程包括规划、准备、实施、结果评估、维护改进5个阶段:

2.1规划

规划健康医疗大数据分类分级的周期、计划和目标。

2.2准备

(1)组织架构

按照业务数据谁处理、数据分类分级谁负责的原则建立数据分类分级的组织架构,数据处理者负责对健康医疗大数据进行梳理并识别重要数据和核心数据。一般由数据安全领导小组及数据管理科室和信息科工作人员以及大数据平台技术人员组成。

(2)数据资产梳理和识别

数据处理者对所掌握的数据进行全面梳理。

结构化数据和半结构化数据主要采取工具探查,人工辅助的方式,工具探查主要基于网络嗅探技术,自动发现指定网段范围下活跃或静默的数据资产,对基于hadoop框架的hive、hbase、hdfs等进行扫描和取样,梳理医疗数据资产清单。如涉及网络运行的,还应梳理网络安全等级保护和关键基础设施保护情况。

非结构化数据大多需要人工识别梳理。

2.3分类分级规则和模板

(1)分类规则

依据GB/T 39725-2020《卫生健康行业数据分类分级指南》采用线分类法和面分类法相结合的方法对健康医疗大数据进行分类,首先用三级线分类法把健康医疗大数据分为3个大类:基础资源类、业务资源类、主题资源类,22个小类。采用面分类法根据实际应用需求将不同小类数据再细分。

(2)分级规则

健康医疗大数据分级首先需要满足监管合规的要求,按照国家法律和卫生健康行业标准梳理出重要数据和核心数据,然后再根据医院实际情况和保护患者隐私的角度将一般数据再分级,应当考虑到数据的重要程度、使用场景,并结合数据被破坏后的影响程度确定其合适的等级。具体来说,对于结构化数据,数据级别是数据项或数据项结合的级别,如数据库表中的某一列或者多个列;对于非结构化数据来说,是指某个文件或文件集合的级别。从实践操作层面来说,数据的分级不宜太过简单,缺乏精准化,但也不宜太过精细化使实施较为复杂,数据级别一般适宜在3-5级之间,当我们使用过于复杂的数据分级方法时,不利于后期的数据治理和管控,我院采用4级标准进行分级。数据分级规则具有一定时效性,随着时间变化、法律法规与政策要求变化等因素可能导致原有数据分级规则不再适用,需要修订分级规则。

依据卫健委分类分级指南将数据分级分为3个级别:核心数据、重要数据、一般数据。我们根据医院的实际情况又将一般数据敏感程度划分为4级极敏感、3级敏感、2级普通敏感、1级不敏感四个级别。其中重要数据和核心数据评估后需要逐级上报,由国家卫健委相关主管部门最终审核认定重要数据和核心数据目录。

重要数据:涉及100万人及以上个人信息或10万人及以上个人敏感信息;全国性业务数据,如涉及10万人的群体健康生理状况数据;涉及1万人的族群生物特征数据、医疗资源数据;涉及10万人的诊疗数据、医疗救援保障数据、特定药品实验数据;经评估的其他数据。核心数据:1000万人及以上个人信息或100万人及以上个人敏感信息;覆盖某一重要特定群体全部个体的数据,特定时期特定区域的群体数据;涉及1000万人及以上,经过计算加工生成的,对数据描述对象有较深刻画程度,且影响国家安全的衍生数据;经评估的其他数据。一般数据:除核心数据和重要数据外的其他数据。

对于一般数据的分级我们根据医院实际情况和数据敏感程度制定规则:

一级数据:不敏感数据,即完全公开数据。医疗机构的地址、名称、法人、电话号码、科室设置、专家介绍、人员编制、床位数、预约号源、疾病预防等数据。

二级数据:普通敏感,即部分公开数据。包括一般个人信息、统计分析结果、医保支付数据、一般健康数据、可穿戴设备自采数据、科研进展数据等。

三级数据:敏感级,限制公开数据,人力资源、财务资源、一般基础设施数据、医技数据、用药数据、医生建议、医生诊疗数据、厂商医药支付记录、医药流通记录等。

四级数据:指极敏感数据,禁止公开数据。对社会造成严重影响,对单个组织的正常运作造成极其严重影响,对人身财产和名誉造成严重损害的数据。个人敏感信息;肿瘤监测诊断数据;家族遗传性疾病数据;鼠疫、霍乱等甲类传染病诊疗数据;艾滋病、病毒性肝炎、脊髓灰质炎、新型冠状病毒肺炎、人感染高致病性禽流感、麻疹、流行性出血热、狂犬病、流行性乙型脑炎、登革热、炭疽、细菌性和阿米巴性痢疾、肺结核、伤寒和副伤寒、流行性脑脊髓膜炎、百日咳、白喉、新生儿破伤风、猩红热、布鲁氏菌病、淋病、梅毒、钩端螺旋体病、血吸虫病、疟疾、甲型H1N1流感等疾病监测和诊疗数据;党政军保密人员,拘留所、监狱等特殊机构人员、公众人物等特定人群的诊疗数据;密码及关联信息;疾病史;吗啡、杜冷丁等特殊药品数据;护理记录、生化检查记录、免疫、PCR检查基因测序结果;财务预算和支付数据;薪酬数据;敏感门急诊数据、敏感住院数据、敏感健康数据、手术数据、关键基础设施数据等。

2.4实施

对于结构化数据和半结构化数据通过分类分级工具设置医疗数据分类分级规则对数据进行分类分级,通过识别数据关键词正则匹配、人工智能自然语言识别、文件指纹识别等技术标识“重要数据”、“核心数据”、“一般数据”的分类分级和敏感级别,人工确认数据标签的准确度和关联度,一般此工作需要多人次多轮重复修正以保证数据识别的准确率。非结构化数据则需要人工识别标记。

2.5结果评估

对分类分级结果进行评估,修正不合理的分类分级标签,经数据安全领导小组审核后输出分类分级报告。

2.6维护改进

医疗机构网络安全管理办法第二十条规定,各医疗卫生机构应每年对数据资产进行全面梳理,在落实网络安全等级保护制度的基础上,依据数据的重要程度以及遭到破坏后的危害程度建立本单位数据分类分级标准。大数据的汇集更是不断变化的,卫生健康行业的重要数据目录和核心数据目录以及医院的分类分级目录实施动态更新机制。目录更新后需要重新做分类分级,因此需要对分类分级进行持续动态更新和维护改进。


3、分级安全防护策略


健康医疗大数据的安全防护策略涉及数据产生、收集、存储、使用、传输、共享、交换和销毁各个环节。我们按照数据的分类分级,采用数据安全管理平台、数据库动静态脱敏、容灾备份、加密认证、数据水印、数据库安全防护、数据审计等技术设备对数据进行分级别安全防护,制定差异化的数据安全防护策略,在策略匹配时按照就高不就低和最小授权原则,如果同一批数据中各属性或字段的分级不同,需要按照定级最高的属性或字段的级别一并实施安全管控,仅授权给数据使用者和处理者满足业务需求的最小授权。建立完善的数据审计机制,定期对数据访问进行审计,根据审计结果调整安全策略。各级数据的具体安全防护策略如下:

对重要数据应实施严格的技术和管理措施,核心数据要在重要数据基础上实行更加严格的管理措施,需采用严格的加密方式,除国家机关依法履职外,核心数据跨主体流动要经国家卫生健康委、国家中医药管理局、国家疾控局信息化主管司局分别报协调机制组织风险评估、安全审查。重要数据和核心数据严禁对外输出,利用数据库安全防护设备对非法的访问进行阻断。严格限制访问权限,仅授权给必要的人员,只有主诊小组、护理人员、会诊人员等需要了解病史的人员可以访问。对重要数据和核心数据要保证全生命周期的数据安全,利用数据水印技术打上水印,以便数据泄露时进行快速溯源。重要数据和核心数据采用持续数据保护和异地容灾备份的备份措施。

对第4级数据应实施严格的技术和管理措施,需采用严格的加密方式,确保数据在传输和存储时的安全性,确保数据访问控制安全,建立严格的数据安全管理规范以及数据实时监控机制。第4级数据除国家机关依法履职和按规定要求上报的数据外不对外输出,利用数据库安全防护设备对非法的访问进行阻断。严格限制访问权限,仅授权给必要的人员,只有主诊小组、护理人员、会诊人员等需要了解病史的人员可以访问。对第4级数据要保证全生命周期的数据安全,可以打上水印,以便数据泄露时快速溯源,备份要有持续数据保护和异地容灾备份。

对第3级数据应实施较严格的技术和管理措施,保护数据的机密性和完整性,可采用相对较弱的加密方式,确保数据访问控制安全,利用数据库安全防护设备对非法的访问进行阻断,建立较严格的数据安全管理规范以及数据实时监控机制。第3级数据授权给相关业务科室可用,在满足相关条件的前提下,比方说对关键数据进行脱敏处理之后可以对外开放。对第3级数据备份可以采用本地定期备份。

对第2级数据应实施必要的技术和管理措施,可以采用较弱的加密和访问控制措施或甚至不加密。确保数据生命周期安全,建立数据安全管理规范。第2级数据可给相关科室开放使用,在满足相关条件的前提下,比方说对关键数据进行脱敏处理之后可以对外开放。对第二级数据可以本地定期备份。

对第1级数据应实施基本的技术和管理措施,无需加密,确保数据生命周期安全。第1级数据全院都可查看,可以直接对外开放,但需要考虑对外开放的数据量及类别,避免由于类别较多或者数据量过大,导致能够用于关联分析。

此外还需要考虑数据的使用场景,如果医院内部使用可采用医院内部访问控制和传输加密等措施。如果是外部使用数据:如与第三方合作、数据共享等,需确保数据传输和存储的安全性,并实施严格的访问控制。


4、结束语


国家数据局等17部门日前联合印发《“数据要素×”三年行动计划(2024—2026年)》明确数据要素供给流通重点任务、保障条件、组织实施等内容,明确提出要落实数据安全法规制度,落实网络安全等级保护制度、关键信息基础设施保护等制度,加强个人信息保护,提升数据安全保障水平。从国家政策层面的原则性规定到行业标准规范,都在探索更为科学、合理的分级方法,各级医疗机构也应该研究制定本单位的分类分级规范,为大数据安全治理打好基础。分类分级已不仅是满足合法、合规的要求,也是医疗机构提升数据管理能力,实现数据差异化管理的必由之路。本文通过对我院健康医疗大数据分类分级和安全防护策略研究,并结合实践应用,为确定科学、合理、合法的健康医疗大数据的分类分级规则、安全防护策略提供思路。


参考文献:

[1]GB/T38667-2020信息技术大数据数据分类指南[S].2020.

[2]GB/T 39725-2020卫生健康行业数据分类分级指南[S].2020.

[3]医疗机构网络安全管理办法[S].

[4]吴霜,陈郑斌.新形势下广东公司大数据实施策略研究[J].2017广东通信青年论坛优秀论文集,2017-05-03.

[5]张萌.大数据应用中数据分级管理研究[J].数字通信世界,2023(06):20.

[6]张琛,司志强,王月辰.新形势下我国医疗数据面临的风险分析与应对措施建议[J].机电产品开发与创新,2023(03):28.

[7]李阳.数据交换系统设计与实现[D].北京交通大学,2006.

[8]李婷.大数据时代下医院档案信息化建设探讨[J].科技资讯,2023(12):05.

[9]什么是医疗大数据,医疗大数据的特征有哪些[EB/OL].


基金资助:济南市卫健委大数据科技计划(2022-YBD-07);


文章来源:路万里.健康医疗大数据分类分级及安全策略[J].网络安全技术与应用,2024,(12):65-67.

分享:

91学术论文范文

相关论文

推荐期刊

网友评论

我要评论

数字通信世界

期刊名称:数字通信世界

期刊人气:1927

期刊详情

主管单位:信息经济与邮政经济

主办单位:电子工业出版社

出版地方:北京

专业分类:科技

国际刊号:1672-7274

国内刊号:11-5154/TN

邮发代号:80-393

创刊时间:2005年

发行周期:月刊

期刊开本:大16开

见刊时间:7-9个月

论文导航

查看更多

相关期刊

热门论文

推荐关键词

【91学术】(www.91xueshu.com)属于综合性学术交流平台,信息来自源互联网共享,如有版权协议请告知删除,ICP备案:冀ICP备19018493号

400-069-1609

微信咨询

返回顶部

发布论文

上传文件

发布论文

上传文件

发布论文

您的论文已提交,我们会尽快联系您,请耐心等待!

知 道 了

登录

点击换一张
点击换一张
已经有账号?立即登录
已经有账号?立即登录

找回密码

找回密码

你的密码已发送到您的邮箱,请查看!

确 定