基于机器学习的慢性病健康数据动态监测方法与流程-尊龙凯时官方app下载

文档序号:36405432发布日期:2023-12-16 11:35阅读:8来源:国知局
基于机器学习的慢性病健康数据动态监测方法与流程

1.本发明涉及数据处理技术领域,具体涉及基于机器学习的慢性病健康数据动态监测方法



背景技术:

2.随着云计算

人工智能和大数据等技术的发展,机器学习算法不断迭代优化,为慢性病健康数据动态监测提供了强大的尊龙凯时官方app下载的技术支持

通过结合机器学习和远程监护技术,可以实现对患者的实时监测和管理

这对于长期慢性病患者来说尤为重要,可以提升他们的生活质量

3.在实际应用中,通常采集慢性病的历史健康数据来进行分析,通过检测历史健康数据是否存在异常数据,判断患者是否存在慢性病病情异常,并可以在后续的动态监测过程中能够对异常快速做出响应并得到及时的治疗

因此,对采集的历史健康数据进行异常检测至关重要

对数据进行异常检测时,通常采用的方式为:根据数据所在的所有叶子结点对应的路径长度,通过孤立森林算法,对采集的数据进行异常检测

4.然而,当直接根据数据所在的所有叶子结点对应的路径长度,通过孤立森林算法,对采集的历史健康数据进行异常检测时,经常会存在如下技术问题:由于孤立森林算法中每个二叉树中同一层叶子结点对应的路径长度往往相同,但是不同的叶子结点包含的历史健康数据往往不同,可能导致同一层叶子结点中有的叶子结点包含正常数据,而有的叶子结点包含异常数据,由于路径长度与异常得分往往呈近似的正相关关系,所以可能导致在计算异常得分的过程中为某些正常数据和异常数据设置相近的异常得分,从而导致对健康数据进行异常检测的准确度较差,进而导致对慢性病健康数据进行监测的准确度较差



技术实现要素:

5.本发明的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述

本发明的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围

6.为了解决由于对健康数据进行异常检测的准确度较差,而导致的对慢性病健康数据进行监测的准确度较差的技术问题,本发明提出了基于机器学习的慢性病健康数据动态监测方法

7.本发明提供了基于机器学习的慢性病健康数据动态监测方法,该方法包括:获取待监测患者在预设时间段内待监测慢性病对应的每个健康监测数据;根据所述预设时间段内所有健康监测数据,通过孤立森林算法,构建目标二叉树集合;对所述目标二叉树集合中的每个目标二叉树中的每个叶子结点包括的每个健康监测数据进行异常波动分析处理,得到每个叶子结点包括的每个健康监测数据对应的异常
波动指标;根据每个叶子结点所在的二叉树层中的所有健康监测数据,确定每个叶子结点包括的每个健康监测数据对应的异常偏离指标;根据每个叶子结点包括的每个健康监测数据对应的异常波动指标和异常偏离指标,以及所有目标二叉树中所有健康监测数据,确定每个叶子结点包括的每个健康监测数据对应的目标异常指标;根据每个叶子结点包括的每个健康监测数据对应的目标异常指标,对每个叶子结点对应的路径长度进行修正,得到每个叶子结点包括的每个健康监测数据对应的修正长度;根据所述预设时间段内的每个健康监测数据对应的所有修正长度,通过孤立森林算法,确定所述预设时间段内的每个健康监测数据对应的目标异常得分;根据所有目标异常得分,判断待监测患者在预设时间段内是否存在待监测慢性病病情异常

8.可选地,所述待监测慢性病为高血压,健康监测数据包括:高压数据和低压数据

9.可选地,所述对所述目标二叉树集合中的每个目标二叉树中的每个叶子结点包括的每个健康监测数据进行异常波动分析处理,得到每个叶子结点包括的每个健康监测数据对应的异常波动指标,包括:对所述预设时间段内所有健康监测数据包括的高压数据进行曲线拟合,得到高压波动曲线,并对所述预设时间段内所有健康监测数据包括的低压数据进行曲线拟合,得到低压波动曲线,其中,高压波动曲线的横坐标为采集时刻,高压波动曲线的纵坐标为高压数据,低压波动曲线的横坐标为采集时刻,低压波动曲线的纵坐标为低压数据;将所述高压波动曲线中每相邻两个极值对应的坐标点之间的曲线段,确定为高压子曲线段,并将所述低压波动曲线中每相邻两个极值对应的坐标点之间的曲线段,确定为低压子曲线段;根据所述叶子结点包括的每个健康监测数据包括的高压数据所属的高压子曲线段,以及其包括的低压数据所属的低压子曲线段,确定所述叶子结点包括的每个健康监测数据对应的异常波动指标

10.可选地,叶子结点包括的健康监测数据对应的异常波动指标对应的公式为:;;;其中,aimj
是第i个目标二叉树中第m个叶子结点包括的第j个健康监测数据对应的异常波动指标;i是目标二叉树集合中目标二叉树的序号;m是第i个目标二叉树中叶子结点的序号;j是第m个叶子结点包括的健康监测数据的序号;
σ
imj1
是第i个目标二叉树中,第m个叶子结点包括的第j个健康监测数据包括的高压数据所在的高压子曲线段对应的高压波动因子;
σ1是所有高压子曲线段对应的高压波动因子的累加值;aimj
是第i个目标二叉树中第m个叶子结点包括的第j个健康监测数据包括的高压数据;a是第i个目标二叉树中,第m个叶子结点包括的第j个健康监测数
据包括的高压数据所在的高压子曲线段中所有高压数据的累加值;
σ
imj2
是第i个目标二叉树中,第m个叶子结点包括的第j个健康监测数据包括的低压数据所在的低压子曲线段对应的低压波动因子;
σ2是所有低压子曲线段对应的低压波动因子的累加值;bimj
是第i个目标二叉树中第m个叶子结点包括的第j个健康监测数据包括的低压数据;b是第i个目标二叉树中,第m个叶子结点包括的第j个健康监测数据包括的低压数据所在的低压子曲线段中所有低压数据的累加值;
||
是取绝对值函数;gimj1
和gimj2
分别是第i个目标二叉树中,第m个叶子结点包括的第j个健康监测数据包括的高压数据所在的高压子曲线段的两个端点对应的纵坐标;
t
imj1

t
imj2
分别是第i个目标二叉树中,第m个叶子结点包括的第j个健康监测数据包括的高压数据所在的高压子曲线段的两个端点对应的横坐标;gimj1
和gimj2
分别是第i个目标二叉树中,第m个叶子结点包括的第j个健康监测数据包括的低压数据所在的低压子曲线段的两个端点对应的纵坐标;
t
imj1

t
imj2
分别是第i个目标二叉树中,第m个叶子结点包括的第j个健康监测数据包括的低压数据所在的低压子曲线段的两个端点对应的横坐标

11.可选地,所述根据每个叶子结点所在的二叉树层中的所有健康监测数据,确定每个叶子结点包括的每个健康监测数据对应的异常偏离指标,包括:根据所述叶子结点包括的每个健康监测数据包括的低压数据和高压数据,以及所述叶子结点所在的二叉树层中的所有健康监测数据包括的低压数据和高压数据,确定所述叶子结点包括的每个健康监测数据对应的异常偏离指标

12.可选地,叶子结点包括的健康监测数据对应的异常偏离指标对应的公式为:
θ
imj
=norm(a
imj-b
im
(b
imj-h
im
))
;其中,
θ
imj
是目标二叉树集合中第i个目标二叉树中第m个叶子结点包括的第j个健康监测数据对应的异常偏离指标;i是目标二叉树集合中目标二叉树的序号;m是第i个目标二叉树中叶子结点的序号;j是第m个叶子结点包括的健康监测数据的序号;
norm( )
是归一化函数;aimj
是第i个目标二叉树中第m个叶子结点包括的第j个健康监测数据包括的高压数据;bim
是第i个目标二叉树中第m个叶子结点所在的二叉树层中的所有健康监测数据包括的高压数据的均值;bimj
是第i个目标二叉树中第m个叶子结点包括的第j个健康监测数据包括的低压数据;him
是第i个目标二叉树中第m个叶子结点所在的二叉树层中的所有健康监测数据包括的低压数据的均值

13.可选地,所述根据每个叶子结点包括的每个健康监测数据对应的异常波动指标和异常偏离指标,以及所有目标二叉树中所有健康监测数据,确定每个叶子结点包括的每个健康监测数据对应的目标异常指标,包括:将健康监测数据包括的低压数据和高压数据,确定为血压数据;根据所述叶子结点的每个健康监测数据对应的异常波动指标和异常偏离指标

所述叶子结点所在目标二叉树中所有血压数据的均值和所有目标二叉树中所有血压数据的均值,确定所述叶子结点的每个健康监测数据对应的目标异常指标

14.可选地,叶子结点包括的健康监测数据对应的目标异常指标对应的公式为:;其中,是目标二叉树集合中第i个目标二叉树中第m个叶子结点包括的第j个健康监测数据对应的目标异常指标;i是目标二叉树集合中目标二叉树的序号;m是第i个目标二叉树中叶子结点的序号;j是第m个叶子结点包括的健康监测数据的序号;
norm( )
是归一化函数;
θ
imj
是目标二叉树集合
中第i个目标二叉树中第m个叶子结点包括的第j个健康监测数据对应的异常偏离指标;aimj
是目标二叉树集合中第i个目标二叉树中第m个叶子结点包括的第j个健康监测数据对应的异常波动指标;
μ
im
是目标二叉树集合中第i个目标二叉树中第m个叶子结点所在目标二叉树中所有血压数据的均值;
μ
是所有目标二叉树中所有血压数据的均值

15.可选地,所述根据每个叶子结点包括的每个健康监测数据对应的目标异常指标,对每个叶子结点对应的路径长度进行修正,得到每个叶子结点包括的每个健康监测数据对应的修正长度,包括:将所述叶子结点包括的每个健康监测数据对应的目标异常指标和所述叶子结点对应的路径长度的乘积,确定为所述叶子结点包括的每个健康监测数据对应的修正长度

16.可选地,所述根据所有目标异常得分,判断待监测患者在预设时间段内是否存在待监测慢性病病情异常,包括:当健康监测数据对应的目标异常得分大于预设异常阈值时,将健康监测数据确定为目标异常数据;当所述预设时间段内存在目标异常数据时,判定待监测患者在预设时间段内存在待监测慢性病病情异常

17.本发明具有如下有益效果:本发明的基于机器学习的慢性病健康数据动态监测方法,通过对健康监测数据进行数据处理,解决了由于对健康数据进行异常检测的准确度较差,而导致的对慢性病健康数据进行监测的准确度较差的技术问题,提高了对健康数据进行异常检测的准确度和对慢性病健康数据进行监测的准确度

首先,获取待监测患者在预设时间段内待监测慢性病对应的每个健康监测数据,可以便于后续对健康监测数据进行异常检测

接着,构建目标二叉树集合,可以便于后续分析每个叶子结点包括的每个健康监测数据的异常情况,可以在一定程度上避免最终由于只考虑路径长度造成的异常结果的误判

然后,对每个叶子结点包括的每个健康监测数据进行异常波动分析处理,可以量化每个叶子结点包括的每个健康监测数据对应的异常波动指标,并且其值越大,往往说明该叶子结点包含的健康监测数据越可能是异常数据

再者,由于孤立森林算法中每个目标二叉树中同一层叶子结点对应的路径长度往往相同,但是不同的叶子结点包含的健康监测数据往往不同,因此综合考虑每个叶子结点所在的二叉树层中的所有健康监测数据,可以提高每个叶子结点包括的每个健康监测数据对应的异常偏离指标确定的准确度,并且其值越大,往往说明该叶子结点包含的健康监测数据越可能是异常数据

继续,综合考虑每个叶子结点包括的每个健康监测数据对应的异常波动指标和异常偏离指标,以及所有目标二叉树中所有健康监测数据,可以提高每个叶子结点包括的每个健康监测数据对应的目标异常指标确定的准确度,并且其值越大,往往说明该叶子结点包含的健康监测数据越可能是异常数据

之后,基于每个叶子结点包括的每个健康监测数据对应的目标异常指标,对每个叶子结点对应的路径长度进行修正,对于同一层的不同叶子结点由于包含的健康监测数据的异常程度可能不同,其对应的修正长度往往也不同,因此修正长度可以在一定程度上区分同一层中不同异常程度的健康监测数据,可以在一定程度上避免由于只考虑路径长度造成的异常结果的误判

最后,基于每个健康监测数据对应的所有修正长度,通过孤立森林算法,确定每个健康监测数据对应的目标异常得分,并基于所有目标异常得分,判断待监测患者在预设时间段内是否存在待
监测慢性病病情异常,实现了对慢性病健康数据的监测,并且相较于直接根据数据所在的所有叶子结点对应的路径长度,通过孤立森林算法,对采集的健康监测数据进行异常检测,本发明量化了每个叶子结点包括的每个健康监测数据的异常情况,比如,量化的修正长度可以在一定程度上区分同一层中包含的不同异常程度的健康监测数据,可以在一定程度上避免由于只考虑路径长度造成的异常结果的误判,从而提高了对健康数据进行异常检测的准确度,进而提高了对慢性病健康数据进行监测的准确度

附图说明
18.为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图

19.图1为本发明的基于机器学习的慢性病健康数据动态监测方法的流程图

具体实施方式
20.为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的技术方案的具体实施方式

结构

特征及其功效,详细说明如下

在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一个实施例

此外,一个或多个实施例中的特定特征

结构或特点可由任何合适形式组合

21.除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同

22.本发明提供了基于机器学习的慢性病健康数据动态监测方法,该方法包括以下步骤:获取待监测患者在预设时间段内待监测慢性病对应的每个健康监测数据;根据预设时间段内所有健康监测数据,通过孤立森林算法,构建目标二叉树集合;对目标二叉树集合中的每个目标二叉树中的每个叶子结点包括的每个健康监测数据进行异常波动分析处理,得到每个叶子结点包括的每个健康监测数据对应的异常波动指标;根据每个叶子结点所在的二叉树层中的所有健康监测数据,确定每个叶子结点包括的每个健康监测数据对应的异常偏离指标;根据每个叶子结点包括的每个健康监测数据对应的异常波动指标和异常偏离指标,以及所有目标二叉树中所有健康监测数据,确定每个叶子结点包括的每个健康监测数据对应的目标异常指标;根据每个叶子结点包括的每个健康监测数据对应的目标异常指标,对每个叶子结点对应的路径长度进行修正,得到每个叶子结点包括的每个健康监测数据对应的修正长度;根据预设时间段内的每个健康监测数据对应的所有修正长度,通过孤立森林算法,确定预设时间段内的每个健康监测数据对应的目标异常得分;根据所有目标异常得分,判断待监测患者在预设时间段内是否存在待监测慢性病
病情异常

23.下面对上述各个步骤进行详细展开:参考图1,示出了根据本发明的基于机器学习的慢性病健康数据动态监测方法的一些实施例的流程

该基于机器学习的慢性病健康数据动态监测方法,包括以下步骤:步骤
s1
,获取待监测患者在预设时间段内待监测慢性病对应的每个健康监测数据

24.在一些实施例中,可以获取待监测患者在预设时间段内待监测慢性病对应的每个健康监测数据

25.其中,上述待监测患者可以是待进行慢性病健康状况监测的患者

预设时间段可以是预先设置的时间段

例如,预设时间段对应的时长可以为一周

上述待监测慢性病可以是预先设置的待进行健康监测的慢性病

慢性病一种病程长

病因复杂

难以治愈的疾病,包括心血管疾病

糖尿病

癌症

慢性呼吸系统疾病等

这些疾病的预防和控制需要长期的管理和治疗,因此,对于慢性病患者的健康管理,动态监测是非常重要的

例如,上述待监测慢性病可以为心血管疾病中的高血压

健康监测数据可以是与待监测慢性病相关的多个维度的数据

例如,若待监测慢性病为高血压,则健康监测数据可以包括两个维度数据,分别可以为高压数据和低压数据

即若待监测慢性病为高血压,则健康监测数据可以包括:高压数据和低压数据

其中,高压数据又称高压

低压数据又称低压

26.需要说明的是,获取待监测患者在预设时间段内待监测慢性病对应的每个健康监测数据,可以便于后续对健康监测数据进行异常检测

27.作为示例,若待监测慢性病为高血压,预设时间段对应的时长为一周,则可以在一周内每隔预设时长采集一次待监测患者的高压数据和低压数据,组合为健康监测数据

其中,预设时长可以是预先设置的时长

例如,预设时长可以为半个小时

28.步骤
s2
,根据预设时间段内所有健康监测数据,通过孤立森林算法,构建目标二叉树集合

29.在一些实施例中,可以根据上述预设时间段内所有健康监测数据,通过孤立森林算法,构建目标二叉树集合

30.需要说明的是,构建目标二叉树集合,可以便于后续分析每个叶子结点包括的每个健康监测数据的异常情况,可以在一定程度上避免最终由于只考虑路径长度造成的异常结果的误判

31.作为示例,可以根据预设时间段内所有健康监测数据,通过孤立森林算法,得到多个二叉树,并将得到的每个二叉树作为目标二叉树,所有目标二叉树组合为目标二叉树集合

32.步骤
s3
,对目标二叉树集合中的每个目标二叉树中的每个叶子结点包括的每个健康监测数据进行异常波动分析处理,得到每个叶子结点包括的每个健康监测数据对应的异常波动指标

33.在一些实施例中,可以对上述目标二叉树集合中的每个目标二叉树中的每个叶子结点包括的每个健康监测数据进行异常波动分析处理,得到每个叶子结点包括的每个健康监测数据对应的异常波动指标

34.需要说明的是,对每个叶子结点包括的每个健康监测数据进行异常波动分析处
理,可以量化每个叶子结点包括的每个健康监测数据对应的异常波动指标,并且其值越大,往往说明该叶子结点包含的健康监测数据越可能是异常数据

35.作为示例,本步骤可以包括以下步骤:第一步,对上述预设时间段内所有健康监测数据包括的高压数据进行曲线拟合,得到高压波动曲线,并对上述预设时间段内所有健康监测数据包括的低压数据进行曲线拟合,得到低压波动曲线

36.其中,高压波动曲线的横坐标可以为采集时刻

高压波动曲线的纵坐标可以为高压数据

低压波动曲线的横坐标可以为采集时刻

低压波动曲线的纵坐标可以为低压数据

37.第二步,将上述高压波动曲线中每相邻两个极值对应的坐标点之间的曲线段,确定为高压子曲线段,并将上述低压波动曲线中每相邻两个极值对应的坐标点之间的曲线段,确定为低压子曲线段

38.第三步,根据上述叶子结点包括的每个健康监测数据包括的高压数据所属的高压子曲线段,以及其包括的低压数据所属的低压子曲线段,确定上述叶子结点包括的每个健康监测数据对应的异常波动指标对应的公式可以为:;;;其中,aimj
是第i个目标二叉树中第m个叶子结点包括的第j个健康监测数据对应的异常波动指标
。i
是目标二叉树集合中目标二叉树的序号
。m
是第i个目标二叉树中叶子结点的序号
。j
是第m个叶子结点包括的健康监测数据的序号

σ
imj1
是第i个目标二叉树中,第m个叶子结点包括的第j个健康监测数据包括的高压数据所在的高压子曲线段对应的高压波动因子;
σ
imj1
是当第j个健康监测数据包括的高压数据不是极值,该高压数据落在一个高压子曲线段上时,计算其所在的高压子曲线段对应的高压波动因子的举例

需要说明的是,若第j个健康监测数据包括的高压数据是极值,该高压数据落在两个高压子曲线段上,则可以将这两个高压子曲线段对应的高压波动因子的均值,作为该高压数据所在的高压子曲线段整体最终对应的高压波动因子

σ1是所有高压子曲线段对应的高压波动因子的累加值
。a
imj
是第i个目标二叉树中第m个叶子结点包括的第j个健康监测数据包括的高压数据
。a
是第i个目标二叉树中,第m个叶子结点包括的第j个健康监测数据包括的高压数据所在的高压子曲线段中所有高压数据的累加值

σ
imj2
是第i个目标二叉树中,第m个叶子结点包括的第j个健康监测数据包括的低压数据所在的低压子曲线段对应的低压波动因子;
σ
imj2
是当第j个健康监测数据包括的低压数据不是极值,该低压数据落在一个低压子曲线段上时,计算其所在的低压子曲线段对应的低压波动因子的举例

需要说明的是,若第j个健康监测数据包括的低压数据是极值,该低压数据落在两个低压子曲线段上,则可以将这两个低压子曲线段对应的低压波动因子的均值,作为该低压数据所在的低压子曲线段整体最终对应的低压波动因子

σ2是所有低压子曲线段对应的低压波动因子的累加值
。b
imj
是第i个目标二叉树中第m个叶子结点包括的第j个健康监测数据包括的低压数据
。b
是第i个目标二叉树中,第m个叶子结点包括的第j个健康监测数据包括的低压数据所在的低压子曲线段中所有低压数据的累加值
。||
是取绝对值
函数
。g
imj1
和gimj2
分别是第i个目标二叉树中,第m个叶子结点包括的第j个健康监测数据包括的高压数据所在的高压子曲线段的两个端点对应的纵坐标
。t
imj1

t
imj2
分别是第i个目标二叉树中,第m个叶子结点包括的第j个健康监测数据包括的高压数据所在的高压子曲线段的两个端点对应的横坐标
。g
imj1
和gimj2
分别是第i个目标二叉树中,第m个叶子结点包括的第j个健康监测数据包括的低压数据所在的低压子曲线段的两个端点对应的纵坐标
。t
imj1

t
imj2
分别是第i个目标二叉树中,第m个叶子结点包括的第j个健康监测数据包括的低压数据所在的低压子曲线段的两个端点对应的横坐标

39.需要说明的是,当
σ
imj1
越大时,往往说明第j个健康监测数据包括的高压数据所在的高压子曲线段的波动变化程度越大,往往说明第j个健康监测数据包括的高压数据越可能是异常数据

因此,当越大时,往往说明第j个健康监测数据包括的高压数据相对越异常


σ
imj2
越大时,往往说明第j个健康监测数据包括的低压数据所在的低压子曲线段的波动变化程度越大,往往说明第j个健康监测数据包括的低压数据越可能是异常数据

因此,当越大时,往往说明第j个健康监测数据包括的低压数据相对越异常

当aimj
越大时,往往说明第j个健康监测数据包括的高压数据越大,往往说明第j个健康监测数据包括的高压数据越可能是异常数据

因此当越大时,往往说明第j个健康监测数据包括的高压数据相对越异常

当bimj
越大时,往往说明第j个健康监测数据包括的低压数据越大,往往说明第j个健康监测数据包括的低压数据越可能是异常数据

所以当越大时,往往说明第j个健康监测数据包括的低压数据相对越异常

因此当aimj
越大时,往往说明第j个健康监测数据相对越异常,往往说明此时待监测患者的病情越可能出现了异常

40.步骤
s4
,根据每个叶子结点所在的二叉树层中的所有健康监测数据,确定每个叶子结点包括的每个健康监测数据对应的异常偏离指标

41.在一些实施例中,可以根据每个叶子结点所在的二叉树层中的所有健康监测数据,确定每个叶子结点包括的每个健康监测数据对应的异常偏离指标

42.其中,叶子结点所在的二叉树层也就是该叶子结点在目标二叉树中的层

43.需要说明的是,由于孤立森林算法中每个目标二叉树中同一层叶子结点对应的路径长度往往相同,但是不同的叶子结点包含的健康监测数据往往不同,因此综合考虑每个叶子结点所在的二叉树层中的所有健康监测数据,可以提高每个叶子结点包括的每个健康监测数据对应的异常偏离指标确定的准确度,并且其值越大,往往说明该叶子结点包含的健康监测数据越可能是异常数据

44.作为示例,根据上述叶子结点包括的每个健康监测数据包括的低压数据和高压数据,以及上述叶子结点所在的二叉树层中的所有健康监测数据包括的低压数据和高压数据,确定上述叶子结点包括的每个健康监测数据对应的异常偏离指标对应的公式可以为:
θ
imj
=norm(a
imj-b
im
(b
imj-h
im
))
;其中,
θ
imj
是目标二叉树集合中第i个目标二叉树中第m个叶子结点包括的第j个健康监测数据对应的异常偏离指标
。i
是目标二叉树集合中
目标二叉树的序号
。m
是第i个目标二叉树中叶子结点的序号
。j
是第m个叶子结点包括的健康监测数据的序号
。norm( )
是归一化函数
。a
imj
是第i个目标二叉树中第m个叶子结点包括的第j个健康监测数据包括的高压数据
。b
im
是第i个目标二叉树中第m个叶子结点所在的二叉树层中的所有健康监测数据包括的高压数据的均值
。b
imj
是第i个目标二叉树中第m个叶子结点包括的第j个健康监测数据包括的低压数据
。h
im
是第i个目标二叉树中第m个叶子结点所在的二叉树层中的所有健康监测数据包括的低压数据的均值

45.需要说明的是,当aimj-b
im
越大时,往往说明第m个叶子结点包括的第j个健康监测数据包括的高压数据相对越高于第m个叶子结点所在的二叉树层中的高压数据,往往说明第m个叶子结点包括的第j个健康监测数据包括的高压数据相对越异常

当bimj-h
im
越大时,往往说明第m个叶子结点包括的第j个健康监测数据包括的低压数据相对越高于第m个叶子结点所在的二叉树层中的低压数据,往往说明第m个叶子结点包括的第j个健康监测数据包括的低压数据相对越异常

因此当
θ
imj
越大时,往往说明第m个叶子结点包括的第j个健康监测数据相对越异常

46.步骤
s5
,根据每个叶子结点包括的每个健康监测数据对应的异常波动指标和异常偏离指标,以及所有目标二叉树中所有健康监测数据,确定每个叶子结点包括的每个健康监测数据对应的目标异常指标

47.在一些实施例中,可以根据每个叶子结点包括的每个健康监测数据对应的异常波动指标和异常偏离指标,以及所有目标二叉树中所有健康监测数据,确定每个叶子结点包括的每个健康监测数据对应的目标异常指标

48.需要说明的是,综合考虑每个叶子结点包括的每个健康监测数据对应的异常波动指标和异常偏离指标,以及所有目标二叉树中所有健康监测数据,可以提高每个叶子结点包括的每个健康监测数据对应的目标异常指标确定的准确度,并且其值越大,往往说明该叶子结点包含的健康监测数据越可能是异常数据

49.作为示例,本步骤可以包括以下步骤:第一步,将健康监测数据包括的低压数据和高压数据,确定为血压数据

50.第二步,根据上述叶子结点的每个健康监测数据对应的异常波动指标和异常偏离指标

上述叶子结点所在目标二叉树中所有血压数据的均值和所有目标二叉树中所有血压数据的均值,确定上述叶子结点包括的每个健康监测数据对应的目标异常指标对应的公式可以为:;其中,是目标二叉树集合中第i个目标二叉树中第m个叶子结点包括的第j个健康监测数据对应的目标异常指标
。i
是目标二叉树集合中目标二叉树的序号
。m
是第i个目标二叉树中叶子结点的序号
。j
是第m个叶子结点包括的健康监测数据的序号
。norm( )
是归一化函数

θ
imj
是目标二叉树集合中第i个目标二叉树中第m个叶子结点包括的第j个健康监测数据对应的异常偏离指标
。a
imj
是目标二叉树集合中第i个目标二叉树中第m个叶子结点包括的第j个健康监测数据对应的异常波动指标

μ
im
是目标二叉树集合中第i个目标二叉树中第m个叶子结点所在目标二叉树中所有血压数据的均值

μ
是所有目标二叉树中所有血压数据的均值

51.需要说明的是,当aimj
越大时,往往说明第j个健康监测数据相对越异常,往往说明
此时待监测患者的病情越可能出现了异常


θ
imj
越大时,往往说明第m个叶子结点包括的第j个健康监测数据相对越异常


μ
im-μ
越大时,往往说明第m个叶子结点所在目标二叉树中的血压数据相对越高于整体目标二叉树中的血压数据,往往说明第m个叶子结点所在目标二叉树中的血压数据相对越异常,往往说明第m个叶子结点包括的第j个健康监测数据可能越异常

所以,当越大时,往往说明第i个目标二叉树中第m个叶子结点包括的第j个健康监测数据相对越异常,往往说明此时待监测患者的病情越可能出现了异常

因此可以表征对第m个叶子结点包括的第j个健康监测数据进行异常判断时,赋予给第m个叶子结点对应的路径长度的权重

52.步骤
s6
,根据每个叶子结点包括的每个健康监测数据对应的目标异常指标,对每个叶子结点对应的路径长度进行修正,得到每个叶子结点包括的每个健康监测数据对应的修正长度

53.在一些实施例中,可以根据每个叶子结点包括的每个健康监测数据对应的目标异常指标,对每个叶子结点对应的路径长度进行修正,得到每个叶子结点包括的每个健康监测数据对应的修正长度

54.需要说明的是,基于每个叶子结点包括的每个健康监测数据对应的目标异常指标,对每个叶子结点对应的路径长度进行修正,对于同一层的不同叶子结点由于包含的健康监测数据的异常程度可能不同,其对应的修正长度往往也不同,因此修正长度可以在一定程度上区分同一层中不同异常程度的健康监测数据,可以在一定程度上避免由于只考虑路径长度造成的异常结果的误判

55.作为示例,可以将上述叶子结点包括的每个健康监测数据对应的目标异常指标和上述叶子结点对应的路径长度的乘积,确定为上述叶子结点包括的每个健康监测数据对应的修正长度

56.步骤
s7
,根据预设时间段内的每个健康监测数据对应的所有修正长度,通过孤立森林算法,确定预设时间段内的每个健康监测数据对应的目标异常得分

57.在一些实施例中,可以根据上述预设时间段内的每个健康监测数据对应的所有修正长度,通过孤立森林算法,确定上述预设时间段内的每个健康监测数据对应的目标异常得分

58.需要说明的是,由于根据预设时间段内所有健康监测数据,通过孤立森林算法,构建目标二叉树集合时,往往会把同一个健康监测数据分配给多个目标二叉树,则同一个健康监测数据可能位于多个叶子结点,而一个叶子结点包括的一个健康监测数据对应一个修正长度,故预设时间段内的一个健康监测数据对应多个修正长度

基于每个健康监测数据对应的所有修正长度,提高了每个健康监测数据对应的目标异常得分确定的准确度

59.作为示例,本步骤可以包括以下步骤:第一步,将每个健康监测数据对应的所有修正长度的均值,确定为上述健康监测数据对应的平均路径长度

60.第二步,根据每个健康监测数据对应的平均路径长度,通过孤立森林算法,计算上述健康监测数据的异常得分,并对上述健康监测数据的异常得分进行归一化,得到上述健康监测数据对应的目标异常得分

61.需要说明的是,现有通过孤立森林算法进行数据异常检测时,往往直接将数据所在的所有叶子结点对应的路径长度的均值作为该数据对应的平均路径长度,本发明则考虑了叶子结点包括的健康监测数据的自身异常情况,并对叶子结点对应的路径长度进行了修正,用健康监测数据对应的所有修正长度的均值作为该健康监测数据对应的平均路径长度,在一定程度上使平均路径长度更加可以用来区分正常数据和异常数据,尤其是更加可以用来区分同一层叶子结点中包含的不同异常程度的健康监测数据

62.步骤
s8
,根据所有目标异常得分,判断待监测患者在预设时间段内是否存在待监测慢性病病情异常

63.在一些实施例中,可以根据所有目标异常得分,判断待监测患者在预设时间段内是否存在待监测慢性病病情异常,实现了对慢性病健康数据的监测

64.作为示例,本步骤可以包括以下步骤:第一步,当健康监测数据对应的目标异常得分大于预设异常阈值时,将健康监测数据确定为目标异常数据

65.其中,预设异常阈值可以是预先设置的阈值

例如,预设异常阈值可以是
0.7。
66.第二步,当上述预设时间段内存在目标异常数据时,判定待监测患者在预设时间段内存在待监测慢性病病情异常

67.综上,相较于直接根据数据所在的所有叶子结点对应的路径长度,通过孤立森林算法,对采集的健康监测数据进行异常检测,本发明量化了每个叶子结点包括的每个健康监测数据的异常情况,比如,量化的修正长度可以相对比较精确地表征对应的叶子结点包括的对应的健康监测数据的异常情况,则量化的修正长度可以在一定程度上区分同一层中包含的不同异常程度的健康监测数据,可以在一定程度上避免由于只考虑路径长度造成的异常结果的误判,从而提高了对健康数据进行异常检测的准确度,进而提高了对慢性病健康数据进行监测的准确度

68.以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,均应包含在本发明的保护范围之内

当前第1页1  
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
网站地图