基于人工智能技术预测蛋白分子相互作用的方法和装置与流程-尊龙凯时官方app下载

文档序号:36405439发布日期:2023-12-16 11:36阅读:7来源:国知局


1.本技术涉及计算机技术

人工智能技术

生物大分子多尺度模拟技术及计算结构生物学技术领域,尤其涉及基于人工智能技术预测蛋白分子相互作用的方法和装置



背景技术:

2.近年来,生物药尤其是蛋白质药物前沿靶点结构建模与计算机技术之间的协同研究与交叉融合,已成为大分子生物药尤其是蛋白质药物研发的前沿新锐技术和核心竞争力

3.较早期的药物主要通过筛选方法获得,筛选方法是最为传统的药物设计方式

数以万计的化合物经大量实验,先甄别化合物的生物活性,再经过体外药理

药代

动物实验等过程的层层筛选,最终进入临床试验

这种随机筛选的方法研制新药的效率极低,非常耗时,代价昂贵;尽管如此,药物研发最终阶段还可能因缺乏足够的安全性或有效性而被迫终止,不能满足现代制药的药物研发进程

自上个世纪
80
年代发展起来一种新的基于计算机模拟与理性设计的方法:计算机辅助药物设计(
computer aided drug design

cadd
)方法,这种方法较传统的药物设计方式,减少了筛选量,提高了药物活性,减少了药物不良反应

但是这种方法仍然损耗极大,据统计应用此设计方法的总成功率仅为
4.1%
,平均耗时
12.5
年,平均投入近
18
亿美金

4.然而上述传统药物设计与计算机辅助药物设计大部分都是针对小分子化学药物开发的,并不适用大分子蛋白质药物

因此,亟需开发新的药物辅助设计方法,辅助挖掘蛋白药物靶点以及定点设计靶向药物



技术实现要素:

5.为解决或部分解决相关技术中存在的问题,本技术提供一种基于人工智能技术预测蛋白分子相互作用的方法和装置,能够快速分析出蛋白分子之间相互作用,可用于辅助挖掘蛋白药物靶点
、ai
计算匹配和定点设计靶向药物,缩短新药开发时间

降低研发成本

6.本技术第一方面提供一种基于人工智能技术预测蛋白分子相互作用的方法,包括:获取具有第一预设相互作用的两个待预测蛋白分子的第一晶体结构;对两个所述第一晶体结构进行自由能极小化模拟,获得自由能满足第一预设条件的两个所述待预测蛋白分子的待预测晶体结构;利用第一预设算法对两个所述待预测晶体结构进行构象搜索及多尺度模拟计算,找出两个所述待预测晶体结构中满足第二预设条件的结合位点或界面;对所述满足第二预设条件的结合位点或界面进行第二预设计算,寻找结合自由能满足第三预设条件的结合位点及相互排布方式;根据所述结合自由能满足第三预设条件的结合位点及相互排布方式,构建两个待预测蛋白分子复合物的复合晶体结构,并分析所述复合晶体结构中两个待预测蛋白分子之
间具有目标相互作用的目标结合位点及结合方式与类型;对所述复合晶体结构进行分子动力学模拟,分析所述复合晶体结构中所述目标结合位点之间的结合状态及相互作用力的强弱

7.作为一个可选的实施例,所述获取具有第一预设相互作用的两个待预测蛋白分子的第一晶体结构,包括:获取带有所述待预测蛋白分子的第二晶体结构;对所述第二晶体结构进行修复,得到修复后的第二晶体结构;从所述修复后的第二晶体结构中分离出所述待预测蛋白分子的第一晶体结构

8.作为一个可选的实施例,所述对两个所述第一晶体结构进行自由能极小化模拟,获得自由能满足第一预设条件的两个所述待预测蛋白分子的待预测晶体结构,包括:分别为两个所述第一晶体结构添加水分子模型与力场,构建两个所述待预测蛋白分子的拓扑结构;为两个所述拓扑结构添加模拟盒子;采用预置方法对添加模拟盒子的两个所述拓扑结构在真空条件下进行自由能极小化模拟的预处理;对添加模拟盒子的两个所述拓扑结构在真空条件下正式进行自由能极小化模拟,将两个模拟结果对应的两个所述拓扑结构转换为两个所述待预测蛋白分子的待预测晶体结构

9.作为一个可选的实施例,所述第一预设算法包括快速傅里叶变换算法,和
/
或,所述第二预设条件包括拓扑结构互补

作用力互补和化学性质互补

10.作为一个可选的实施例,所述对所述满足第二预设条件的结合位点或界面进行第二预设计算,寻找所述结合自由能满足第三预设条件的结合位点及相互排布方式,包括:基于第二预设算法,对所述满足第二预设条件的结合位点或界面进行预设次数的局部叠加微移及扭转;迭代生成两个所述待预测晶体结构的多个满足第二预设条件的结合位点或界面;计算两个所述待预测晶体结构的多个满足第二预设条件的结合位点或界面的结合自由能,并寻找出结合自由能最低的结合位点及相互排布方式

11.作为一个可选的实施例,所述目标相互作用包括氢键作用

盐键作用

静电作用

疏水作用和范德华力作用

12.作为一个可选的实施例,所述对所述复合晶体结构进行分子动力学模拟,分析所述复合晶体结构中所述目标结合位点之间的结合状态及相互作用力的强弱,包括:将所述复合晶体结构转换为拓扑结构;为所述拓扑结构添加溶液模型

离子模型,以使所述拓扑结构达到电荷平衡的生理状态;分别在正则系综与等温等压系综中对达到电荷平衡的生理状态的所述拓扑结构进行分子动力学模拟,直至所述拓扑结构达到运动平衡状态;分析达到运动平衡状态的所述拓扑结构中所述目标结合位点之间的结合状态及相互作用力的强弱;若所述拓扑结构中所述目标结合位点分离,则预测所述两个待预测蛋白分子之间
为弱相互作用;若所述拓扑结构中所述目标结合位点维持结合,则预测所述两个待预测蛋白分子之间为强相互作用

13.本技术第二方面提供一种基于人工智能技术预测蛋白分子相互作用的装置,包括:获取模块,用于获取具有第一预设相互作用的两个待预测蛋白分子的第一晶体结构;自由能极小化模拟模块,用于对两个所述第一晶体结构进行自由能极小化模拟,获得自由能满足第一预设条件的两个所述待预测蛋白分子的待预测晶体结构;第一算法模块,用于利用第一预设算法对两个所述待预测晶体结构进行构象搜索及多尺度模拟计算,找出两个所述待预测晶体结构中满足第二预设条件的结合位点或界面;第二算法模块,用于对所述满足第二预设条件的结合位点或界面进行第二预设计算,寻找结合自由能满足第三预设条件的结合位点及相互排布方式;建模模块,用于根据所述结合自由能满足第三预设条件的结合位点及相互排布方式,构建两个待预测蛋白分子复合物的复合晶体结构,并分析所述复合晶体结构中两个待预测蛋白分子之间具有目标相互作用的目标结合位点及结合方式与类型;分析模块,用于对所述复合晶体结构进行分子动力学模拟,分析所述复合晶体结构中所述目标结合位点之间的结合状态及相互作用力的强弱

14.本技术第三方面提供一种电子设备,包括:处理器;以及存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如上所述的方法

15.本技术第四方面提供一种计算机可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如上所述的方法

16.本技术提供的技术方案可以包括以下有益效果:本技术首先获取具有第一预设相互作用的两个待预测蛋白分子的第一晶体结构,例如蛋白药物及其受体蛋白分子;再通过自由能极小化模拟,获得自由能较低的两个待预测蛋白分子的待预测晶体结构,即稳定性较高的两个待预测蛋白分子的待预测晶体结构;然后对两个待预测晶体结构进行构象搜索及多尺度模拟计算,找出两个预测晶体结构中满足第二预设条件的结合位点或界面,也就是从稳定性较高的两个待预测蛋白分子的待预测晶体结构中初步找出在形状

电荷

性质等方面匹配的结合位点或界面;再然后对这些结合位点或界面进行第二预设计算,寻找两个待预测晶体结构满足第三预设条件的结合位点及相互排布方式,即找出结合自由能较低的结合位点及相互排布方式,这些结合位点及相互排布方式有很大可能影响蛋白药物与受体蛋白分子之间的结合强弱;再根据这些结合位点及相互排布方式,构建两个待预测蛋白分子复合物的复合晶体结构,并分析复合晶体结构中两个待预测蛋白分子之间具有目标相互作用的目标结合位点及结合方式与类型,即通过模拟待预测蛋白分子复合物的复合晶体结构,确定蛋白药物及其受体蛋白分子结合所形成的复合物中使蛋白药物及其受体蛋白分子紧密结合的目标结合位点及结合方式与类型;最
后对复合晶体结构进行分子动力学模拟,分析复合晶体结构中目标结合位点之间的结合状态及相互作用力的强弱,即通过模拟蛋白药物使用的生理环境,分析使蛋白药物与其受体蛋白分子之间紧密结合的目标结合位点是否仍保持紧密结合,从而可以预测蛋白药物与其受体蛋白分子之间靶向结合的强弱

因此,本技术可快速准确地预测蛋白药物与其受体蛋白分子之间的相互作用,可用于辅助挖掘蛋白药物靶点
、ai
计算匹配和定点设计靶向药物,从而大大缩短新药开发时间

降低研发成本

17.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本技术

附图说明
18.通过结合附图对本技术示例性实施方式进行更详细地描述,本技术的上述以及其它目的

特征和优势将变得更加明显,其中,在本技术示例性实施方式中,相同的参考标号通常代表相同部件

19.图1是本技术实施例示出的基于人工智能技术预测蛋白分子相互作用的方法的流程示意图;图2是本技术实施例示出的基于人工智能技术预测蛋白分子相互作用的方法的另一流程示意图;图3是本技术实施例示出的基于人工智能技术预测蛋白分子相互作用的方法的流程框架示意图;图4是本技术实施例示出的
fgf22
蛋白分子和
fgfr
蛋白分子具有目标相互作用的目标结合位点和界面的示意图;图5是本技术实施例示出的基于人工智能技术预测蛋白分子相互作用的装置的结构示意图;图6是本技术实施例示出的电子设备的结构示意图

具体实施方式
20.下面将参照附图更详细地描述本技术的实施方式

虽然附图中显示了本技术的实施方式,然而应该理解,可以以各种形式实现本技术而不应被这里阐述的实施方式所限制

相反,提供这些实施方式是为了使本技术更加透彻和完整,并且能够将本技术的范围完整地传达给本领域的技术人员

21.在本技术使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本技术

在本技术和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义

还应当理解,本文中使用的术语“和
/
或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合

22.应当理解,尽管在本技术可能采用术语“第一”、“第二”、“第三”等来描述各种信息,但这些信息不应限于这些术语

这些术语仅用来将同一类型的信息彼此区分开

例如,在不脱离本技术范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息

由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征

在本技术的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限


23.传统药物设计与计算机辅助药物设计大部分都是针对小分子化学药物开发的,并不适用大分子蛋白质药物

因此,亟需开发新的药物辅助设计方法,辅助挖掘蛋白药物靶点以及定点设计靶向药物

24.针对上述问题,本技术实施例提供一种基于人工智能技术预测蛋白分子相互作用的方法,能够快速分析出蛋白分子之间相互作用,可用于辅助挖掘蛋白药物靶点
、ai
计算匹配和定点设计靶向药物,缩短新药开发时间

降低研发成本

25.以下结合附图详细描述本技术实施例的技术方案

26.图1是本技术实施例示出的基于人工智能技术预测蛋白分子相互作用的方法的流程示意图

27.参见图1,本技术实施例提供了一种基于人工智能技术预测蛋白分子相互作用的方法,包括如下步骤
s1
至步骤
s6
:步骤
s1
:获取具有第一预设相互作用的两个待预测蛋白分子的第一晶体结构

28.两个待预测蛋白分子可能具有相互作用,本技术可以获取具有第一预设相互作用的两个待预测蛋白分子的第一晶体结构

本技术实施例中的第一预设相互作用可以为配体与受体结合的相互作用

抗原与抗体结合的相互作用

多聚体蛋白中蛋白亚基之间结合的相互作用

以及其它具有亲和作用的两个蛋白结合的相互作用

29.本技术实施例可通过以下方式获得待预测蛋白分子的第一晶体结构:获取待预测蛋白分子的第二晶体结构;对第二晶体结构进行晶体结构修复,得到修复后的第二晶体结构;从修复后的第二晶体结构中分离出目标蛋白分子的第一晶体结构

30.其中,本技术实施例的第二晶体结构指待预测蛋白分子通过生物物理学方法解析出的晶体结构

第二晶体结构可以从蛋白质结构数据库(
protein data bank
,简称
pdb
)获得

其中,蛋白质结构数据库可以预先构建

31.本技术实施例大多数情况所研究的待预测蛋白分子的晶体结构未被解析,或未被收录于蛋白质结构数据库中,可以采用相关技术的同源建模方法或从头计算建模方法进行建模,本技术对此不加以限定

32.步骤
s2
:对两个第一晶体结构进行自由能极小化模拟,获得自由能满足第一预设条件的两个待预测蛋白分子的待预测晶体结构

33.本技术实施例可以通过以下方式获得两个待预测蛋白分子的待预测晶体结构:分别为两个待预测蛋白分子的第一晶体结构添加水分子模型与力场,构建两个待预测蛋白分子的拓扑结构;为两个拓扑结构添加模拟盒子;采用预置方法对添加模拟盒子的两个拓扑结构在真空条件下进行自由能极小化模拟的预处理;对添加模拟盒子的两个拓扑结构在真空条件下正式进行自由能极小化模拟,将两个模拟结果对应的两个拓扑结构转换为两个待预测蛋白分子的待预测晶体结构

34.步骤
s3
:利用第一预设算法对两个待预测晶体结构进行构象搜索及多尺度模拟计算,找出两个待预测晶体结构中满足第二预设条件的结合位点或界面

35.本技术实施例可以通过以下方式找出两个待预测晶体结构中满足第二预设条件的结合位点或界面:利用快速傅里叶变换算法对两个待预测晶体结构进行构象搜索及多尺度模拟计算;找出两个待预测晶体结构中满足第二预设条件的结合位点或界面,第二预设
条件可以包括拓扑结构互补

作用力互补和化学性质互补

36.步骤
s4
:对满足第二预设条件的结合位点或界面进行第二预设计算,寻找结合自由能满足第三预设条件的结合位点及相互排布方式

37.本技术实施例可以通过以下方式寻找结合自由能满足第二预设条件的结合位点及相互排布方式:基于第二预设算法,对满足第二预设条件的结合位点或界面进行预设次数的局部叠加微移及扭转;迭代生成两个待预测晶体结构的多个满足第二预设条件的结合位点或界面;计算两个待预测晶体结构的多个满足第二预设条件的结合位点或界面的结合自由能,并寻找出结合自由能最低的结合位点及相互排布方式

38.步骤
s5
:根据结合自由能满足第三预设条件的结合位点及相互排布方式,构建两个待预测蛋白分子复合物的复合晶体结构,并分析复合晶体结构中两个待预测蛋白分子之间具有目标相互作用的目标结合位点及结合方式与类型

39.本技术实施例中的目标相互作用包括氢键作用

盐键作用

静电作用

疏水作用和范德华力作用

40.步骤
s6
:对复合晶体结构进行分子动力学模拟,分析复合晶体结构中目标结合位点之间的结合状态及相互作用力的强弱

41.本技术实施例可以通过以下方式分析复合晶体结构中目标结合位点之间的结合状态及相互作用力的强弱:将复合晶体结构转换为拓扑结构;为拓扑结构添加溶液模型

离子模型,以使拓扑结构达到电荷平衡的生理状态;分别在正则系综与等温等压系综中对达到电荷平衡的生理状态的拓扑结构进行分子动力学模拟,直至拓扑结构达到运动平衡状态;分析达到运动平衡状态的拓扑结构中目标结合位点之间的结合状态及相互作用力的强弱;若拓扑结构中目标结合位点分离,则预测两个待预测蛋白分子之间为弱相互作用;若拓扑结构中目标结合位点维持结合,则预测两个待预测蛋白分子之间为强相互作用

42.本技术实施例首先获取具有第一预设相互作用的两个待预测蛋白分子的第一晶体结构,例如蛋白药物及其受体蛋白分子;再通过自由能极小化模拟,获得自由能较低的两个待预测蛋白分子的待预测晶体结构,即稳定性较高的两个待预测蛋白分子的待预测晶体结构;然后对两个待预测晶体结构进行构象搜索及多尺度模拟计算,找出两个预测晶体结构中满足第二预设条件的结合位点或界面,也就是从稳定性较高的两个待预测蛋白分子的待预测晶体结构中初步找出在形状

电荷

性质等方面匹配的结合位点或界面;再然后对这些结合位点或界面进行第二预设计算,寻找两个待预测晶体结构满足第三预设条件的结合位点及相互排布方式,即找出结合自由能较低的结合位点及相互排布方式,这些结合位点及相互排布方式有很大可能影响蛋白药物与受体蛋白分子之间的结合强弱;再根据这些结合位点及相互排布方式,构建两个待预测蛋白分子复合物的复合晶体结构,并分析复合晶体结构中两个待预测蛋白分子之间具有目标相互作用的目标结合位点及结合方式与类型,即通过模拟待预测蛋白分子复合物的复合晶体结构,确定蛋白药物及其受体蛋白分子结合所形成的复合物中使蛋白药物及其受体蛋白分子紧密结合的目标结合位点及结合方式与类型;最后对复合晶体结构进行分子动力学模拟,分析复合晶体结构中目标结合位点之间的结合状态及相互作用力的强弱,即通过模拟蛋白药物使用的生理环境,分析使蛋白药物与其受体蛋白分子之间紧密结合的目标结合位点是否仍保持紧密结合,从而可以预测蛋白药物与其受体蛋白分子之间靶向结合的强弱

因此,本技术实施例可快速准确地预测蛋白
药物与其受体蛋白分子之间的相互作用,可用于辅助挖掘蛋白药物靶点
、ai
计算匹配和定点设计靶向药物,从而大大缩短新药开发时间

降低研发成本

43.图2是本技术实施例示出的基于人工智能技术预测蛋白分子相互作用的方法的另一流程示意图

图3是本技术实施例示出的基于人工智能技术预测蛋白分子相互作用的方法的流程框架示意图

44.参见图2和图3,本技术实施例提供的基于人工智能技术预测蛋白分子相互作用的方法,包括以下步骤:步骤
s10
:获取带有待预测蛋白分子的第二晶体结构

45.本技术实施例的第二晶体结构指待预测蛋白分子通过生物物理学方法解析出的晶体结构

第二晶体结构可以从蛋白质结构数据库(
protein data bank
,简称
pdb
)获得

46.步骤
s11
:对第二晶体结构进行修复,得到修复后的第二晶体结构

47.本技术实施例中第二晶体结构的修复包括:第二晶体结构中谷氨酰胺残基

天冬酰胺残基侧链中的酰胺基团与组氨酸残基侧链中的咪唑基团的电子密度对称性极高,需要将这些氨基酸残基侧链翻转
180
°
,再通过计算与周围原子的相互作用来判定具体位置

其它氨基酸残基则通过侧链基团或肽平面的细微旋转使得能量最优,最终得到修复后的第二晶体结构

48.步骤
s12
:从修复后的第二晶体结构中分离出待预测蛋白分子的第一晶体结构

49.其中,可以采用相关技术中的分离方法,从修复后的第二晶体结构中分离出目标蛋白分子的第一晶体结构,本技术对此不加以限定

50.本技术实施例大多数情况所研究的待预测蛋白分子的晶体结构未被解析,或未被收录于蛋白质结构数据库中,可以采用相关技术的同源建模方法或从头计算建模方法进行建模,本技术对此不加以限定

51.步骤
s20
:分别为两个待预测蛋白分子的第一晶体结构添加水分子模型与力场,构建两个待预测蛋白分子的拓扑结构

52.本技术实施例可以利用分子动力学模拟,输入第一晶体结构,为第一晶体结构添加例如
tip3p
的水分子模型以及例如
amber99sb-ildn
的力场,构建两个待预测蛋白分子的拓扑结构

53.步骤
s21
:为两个拓扑结构添加模拟盒子

54.本技术实施例的模拟盒子可以为溶剂盒子,可以定义模拟盒子的形状和大小,例如可以为目标蛋白分子的拓扑结构添加与边界距离为
2nm
的立方体模拟盒子

55.步骤
s22
:采用预置方法对添加模拟盒子的两个拓扑结构在真空条件下进行自由能极小化模拟的预处理

56.本技术实施例的预置方法可以为最陡下降法,可根据实际情况设置能量极小化的步数

57.步骤
s23
:对添加模拟盒子的两个拓扑结构在真空条件下正式进行自由能极小化模拟,将两个模拟结果对应的两个拓扑结构转换为两个待预测蛋白分子的待预测晶体结构

58.本技术实施例通过自由能极小化模拟得到的两个待预测晶体结构可以为自由能极小化晶体结构

59.步骤
s30
:利用快速傅里叶变换算法对两个待预测晶体结构进行构象搜索及多尺度模拟计算,找出两个待预测晶体结构中满足第二预设条件的结合位点或界面,第二预设条件包括拓扑结构互补

作用力互补和化学性质互补

60.本技术实施例的第一预设算法可以为快速傅里叶变换算法,通过快速傅里叶变换算法对两个待预测晶体结构进行构象搜索及多尺度模拟计算,能够快速准确找出两个待预测晶体结构中满足第二预设条件的结合位点或界面

61.步骤
s40
:基于第二预设算法,对满足第二预设条件的结合位点或界面进行预设次数的局部叠加微移及扭转

62.第二预设算法为精细化计算,对满足第二预设条件的结合位点或界面进行局部微小移动及扭转;每次结合位点或界面随机移动
0.5nm
或者扭转3°
,首次移动及扭转之后,生成出1个新的相互作用结合位点或界面,并计算新的相互作用结合位点或界面结合自由能

相互作用结合位点或界面结合自由能计算如下公式:
63.a
和b分别表示两个蛋白分子,
δhgas
表示气相环境下分子结合过程中r和
l
的焓变,

与分别表示液相环境下两个蛋白及其复合物的溶剂化自由能变,
δs表示对接过程中熵变,
t
表示体系绝对温度

64.步骤
s41
:迭代生成两个待预测晶体结构的多个满足第二预设条件的结合位点或界面

65.在前一个相互作用结合位点或界面基础上,通过
5000
次局部微小移动及扭转,迭代生成出
5000
个相互作用结合位点或界面并计算对应的结合自由能

66.步骤
s42
:计算两个待预测晶体结构的多个满足第二预设条件的结合位点或界面的结合自由能,并寻找出结合自由能最低的结合位点及相互排布方式

67.从
5000
个计算结果中寻找结合自由能最低(即结合自由能最佳)的结合位点或界面,并作为目标结合位点

68.步骤
s50
:根据结合自由能满足第三预设条件的结合位点及相互排布方式,构建两个待预测蛋白分子复合物的复合晶体结构

69.本技术实施例可以采用相关技术的同源建模方法或从头计算建模方法进行构建两个待预测蛋白分子复合物的复合晶体结构

70.步骤
s51
:分析复合晶体结构中两个待预测蛋白分子之间具有目标相互作用的目标结合位点

71.本技术实施例的目标相互作用包括氢键作用

盐键作用

静电作用

疏水作用和范德华力作用

72.步骤
s52
:分析目标结合位点之间的结合方式与类型

73.目标结合位点之间的结合方式与类型与目标相互作用相对应,也可以包括氢键

盐键

静电

疏水和范德华力

74.步骤
s60
:将复合晶体结构转换为拓扑结构

75.本技术实施例可以利用分子动力学模拟,输入复合晶体结构,添加例如
tip3p
的水分子模型以及例如
amber99sb-ildn
的力场,构建复合晶体结构的拓扑结构

76.步骤
s61
:为拓扑结构添加溶液模型

离子模型,以使拓扑结构达到电荷平衡的生理状态

77.本技术实施例可以利用分子动力学模拟,输入拓扑结构,添加例如
spc216
溶液模型和生理条件浓度的离子模型,使拓扑结构达到电荷平衡的生理状态

78.步骤
s62
:分别在正则系综与等温等压系综中对达到电荷平衡的生理状态的拓扑结构进行分子动力学模拟,直至拓扑结构达到运动平衡状态

79.本技术实施例将添加生理条件环境的拓扑结构分别在正则系综与等温等压系综中进行分子动力学模拟,直至添加生理条件环境的拓扑结构处于运动平衡状态

80.步骤
s63
:分析达到运动平衡状态的拓扑结构中目标结合位点之间的结合状态及相互作用力的强弱

81.步骤
s64
:若拓扑结构中目标结合位点分离,则预测两个待预测蛋白分子之间为弱相互作用

82.步骤
s65
:若拓扑结构中目标结合位点维持结合,则预测两个待预测蛋白分子之间为强相互作用

83.本技术实施例可以将两个待预测蛋白分子之间的目标结合位点之间的目标相互作用分为强

弱两类

若拓扑结构中目标结合位点分离,则预测两个待预测蛋白分子之间为弱相互作用;若拓扑结构中目标结合位点维持结合,则预测两个待预测蛋白分子之间为强相互作用

因此,本技术实施例可以预测两个待预测蛋白分子之间的相互作用,基于相互作用分析结果,可用于理性挖掘蛋白药物靶点
、ai
计算匹配和定点设计靶向药物,可大大缩短新药开发时间以及降低研发成本

84.下面本技术实施例以人成纤维细胞生长因子
22

fgf22
)与人成纤维细胞生长因子受体(
fgfr
)为例,对基于人工智能技术预测蛋白分子相互作用的方法进行说明,但并不局限于此例,包括以下步骤:
1、
先从
pdb
数据库中获得通过结晶与
x
射线衍射方法解析得到的带有
fgfr
的第二晶体结构
1nun
,再对第二晶体结构
1nun
进行修复,最后从修复后的第二晶体结构
1nun
中分离出
fgfr
蛋白分子的第一晶体结构

对第二晶体结构
1nun
进行修复包括:第二晶体结构
1nun
中谷氨酰胺残基

天冬酰胺残基侧链中的酰胺基团与组氨酸残基侧链中的咪唑基团的电子密度对称性极高,需要将这些氨基酸残基侧链翻转
180
°
,通过计算与周围原子的相互作用来判定具体位置;其它氨基酸残基则通过侧链基团或肽平面的细微旋转使得能量最优;最终得到修复后的第二晶体结构
1nun。
由于
fgf22
晶体结构未被解析,或未被收录于
pdb
数据库中,可以采用相关技术的同源建模方法进行建模,直接获取
fgf22
蛋白分子的第一晶体结构

85.2、
分别对
fgf22

fgfr
第一晶体结构进行自由能极小化模拟,获得
fgf22

fgfr
蛋白分子的能量极小化晶体结构

例如可以先利用分子动力学模拟,分别输入
fgf22

fgfr
蛋白分子的第一晶体结构,添加
tip3p
水分子模型与
amber99sb-ildn
力场,构建
fgf22

fgfr
蛋白分子的拓扑结构;再添加与边界距离为
2nm
的立方体模拟盒子;然后先采用最陡下降法对
fgf22

fgfr
蛋白分子的拓扑结构在真空条件下进行能量最小化预处理,再对
fgf22

fgfr
蛋白分子的拓扑结构在真空条件下正式进行能量极小化模拟,将模拟的能量极小化拓扑结构转换为
fgf22

fgfr
蛋白分子的能量极小化晶体结构

86.3、
基于例如快速傅里叶变换(
fft
)算法的预设算法,对
fgf22

fgfr
蛋白分子的能量极小化晶体结构进行构象搜索及多尺度模拟计算,找出满足第二预设条件的结合位点或界面,第二预设条件包括拓扑结构互补

作用力互补

化学性质互补

87.4、
对上一步计算出的
fgf22

fgfr
满足第二预设条件的结合位点或界面进行精细化计算,寻找最佳结合自由能的目标结合位点及相互排布方式

例如对
fgf22

fgfr
满足第二预设条件的结合位点或界面进行局部微小移动及扭转,每次位点或界面随机移动
0.5nm
或者扭转3°
,生成出1个新的相互作用结合位点或界面,并计算新相互作用结合位点或界面结合自由能;在前一个相互作用结合位点或界面基础上,通过
5000
次局部微小移动及扭转,迭代生成出
5000
个相互作用结合位点或界面并计算对应的结合自由能;结合自由能最低的相互作用结合位点或界面即为最佳结合自由能的目标结合位点与相互排布方式

88.5、
选择结合自由能最低的
fgf22

fgfr
相互作用放入目标结合位点或界面,即
fgf22

fgfr
最佳结合自由能的结合位点及相互排布方式,构建
fgf22

fgfr
蛋白分子复合物的复合晶体结构,分析
fgf22

fgfr
蛋白分子复合物的复合晶体结构中的两个蛋白分子之间的相互作用的位点

结合方式与类型

89.6、

fgf22

fgfr
蛋白分子复合物的复合晶体结构进行生理状态下分子动力学模拟,分析
fgf22

fgfr
复合物的复合晶体结构中目标结合位点的结合及作用力强度

利用分子动力学模拟,输入
fgf22

fgfr
蛋白分子复合物的复合晶体结构,先添加例如
tip3p
的水分子模型以及例如
amber99sb-ildn
的力场,构建
fgf22

fgfr
蛋白分子复合物的复合晶体结构的拓扑结构;再对拓扑结构添加例如
spc216
溶液模型和生理条件浓度的离子模型,使拓扑结构达到电荷平衡的生理状态;分别在正则系综与等温等压系综中对达到电荷平衡的生理状态的拓扑结构进行分子动力学模拟,直至拓扑结构达到运动平衡状态;分析分析运动平衡的状态的拓扑结构中
fgf22

fgfr
蛋白分子的相互作用变化:若在运动平衡的状态下,拓扑结构中
fgf22

fgfr
蛋白分子相互分离,则预测
fgf22

fgfr
蛋白分子之间为弱相互作用;若在运动平衡的状态下,拓扑结构中
fgf22

fgfr
蛋白分子维持结合,则预测
fgf22

fgfr
蛋白分子之间为强相互作用

90.7、
通过上述方法,计算出
fgf22
蛋白分子中第
39、35、36、77、117、119、124、122、123、125
位氨基酸残基与
fgfr
蛋白分子中第
173、251、282、283、285、319、345
位氨基酸残基之间具有氢键相互作用;
fgf22
蛋白分子中第
33、37、41、46、50、65、67、76、78、79、80、81、84、94、140、165
位氨基酸残基与
fgfr
蛋白分子中第
161、164、165、166、167、168、170、252、280、281、284、286、287、288、315、316、317、320、344
位氨基酸残基之间具有疏水相互作用(见图4)
。fgf22

fgfr
蛋白分子复合物拓扑结构生理状态下分子动力学模拟中,
fgf22

fgfr
蛋白分子维持结合,运动状态下复合物中的
fgf22

fgfr
蛋白分子没有分离,则预测
fgf22

fgfr
蛋白分子之间为强相互作用

91.与前述应用功能实现方法实施例相对应,本技术还提供了一种运用人工智能等技术高精度预测蛋白分子相互作用的装置

电子设备及相应的实施例

92.图5是本技术实施例示出的基于人工智能技术预测蛋白分子相互作用的装置的结构示意图

93.参见图5,本技术实施例提供的一种基于人工智能技术预测蛋白分子相互作用的装置包括:
获取模块
50
,用于获取具有第一预设相互作用的两个待预测蛋白分子的第一晶体结构

94.自由能极小化模拟模块
51
,用于对两个待预测蛋白分子的第一晶体结构进行自由能极小化模拟,获得自由能满足第一预设条件的两个待预测蛋白分子的待预测晶体结构

95.第一算法模块
52
,用于利用第一预设算法对两个待预测晶体结构进行构象搜索及多尺度模拟计算,找出两个待预测晶体结构中满足第二预设条件的结合位点或界面

96.第二算法模块
53
,用于对两个待预测晶体结构中满足第二预设条件的结合位点或界面进行第二预设计算,寻找两个待预测晶体结构中结合自由能满足第三预设条件的结合位点及相互排布方式

97.建模模块
54
,用于根据满足第三预设条件的结合位点及相互排布方式,构建两个待预测蛋白分子复合物的复合晶体结构,并分析复合晶体结构中两个待预测蛋白分子之间具有目标相互作用的目标结合位点及结合方式与类型

98.分析模块
55
,用于对复合晶体结构进行分子动力学模拟,分析复合晶体结构中目标结合位点之间的结合状态及相互作用力的强弱

99.本技术实施例首先通过获取模块
50
获取具有第一预设相互作用的两个待预测蛋白分子的第一晶体结构,例如蛋白药物及其受体蛋白分子;再通过自由能极小化模拟模块
51
进行自由能极小化模拟,获得自由能较低的两个待预测蛋白分子的待预测晶体结构,即稳定性较高的两个待预测蛋白分子的待预测晶体结构;然后通过第一算法模块
52
对两个待预测晶体结构进行构象搜索及多尺度模拟计算,找出两个预测晶体结构中满足第二预设条件的结合位点或界面,也就是从稳定性较高的两个待预测蛋白分子的待预测晶体结构中初步找出在形状

电荷

性质等方面匹配的结合位点或界面;再然后通过第二算法模块
53
对这些结合位点或界面进行第二预设计算,寻找两个待预测晶体结构满足第三预设条件的结合位点及相互排布方式,即找出结合自由能较低的结合位点及相互排布方式,这些结合位点及相互排布方式有很大可能影响蛋白药物与受体蛋白分子之间的结合强弱;再通过建模模块
54
根据这些结合位点及相互排布方式,构建两个待预测蛋白分子复合物的复合晶体结构,并分析复合晶体结构中两个待预测蛋白分子之间具有目标相互作用的目标结合位点及结合方式与类型,即通过模拟待预测蛋白分子复合物的复合晶体结构,确定蛋白药物及其受体蛋白分子结合所形成的复合物中使蛋白药物及其受体蛋白分子紧密结合的目标结合位点及结合方式与类型;最后通过分析模块
55
对复合晶体结构进行分子动力学模拟,分析复合晶体结构中目标结合位点之间的结合状态及相互作用力的强弱,即通过模拟蛋白药物使用的生理环境,分析使蛋白药物与其受体蛋白分子之间紧密结合的目标结合位点是否仍保持紧密结合,从而可以预测蛋白药物与其受体蛋白分子之间靶向结合的强弱

因此,本技术实施例可快速准确地预测蛋白药物与其受体蛋白分子之间的相互作用,可用于辅助挖掘蛋白药物靶点
、ai
计算匹配和定点设计靶向药物,从而大大缩短新药开发时间

降低研发成本

100.作为一个可选的实施例,本技术实施例中的获取模块
50
包括获取子模块

修复模块和分离模块,获取子模块用于获取带有待预测蛋白分子的第二晶体结构;修复模块用于对第二晶体结构进行修复,得到修复后的第二晶体结构;分离模块用于从修复后的第二晶体结构中分离出待预测蛋白分子的第一晶体结构

101.作为一个可选的实施例,本技术实施例中的自由能极小化模拟模块
51
具体用于分别为两个待预测蛋白分子的第一晶体结构添加水分子模型与力场,构建两个待预测蛋白分子的拓扑结构;为两个拓扑结构添加模拟盒子;采用预置方法对添加模拟盒子的两个拓扑结构在真空条件下进行自由能极小化模拟的预处理;对添加模拟盒子的两个拓扑结构在真空条件下正式进行自由能极小化模拟,将两个模拟结果对应的两个拓扑结构转换为两个待预测蛋白分子的待预测晶体结构

102.作为一个可选的实施例,本技术实施例中的第二算法模块
53
包括精细计算模块

迭代模块和寻找模块,精细计算模块用于基于第二预设算法,对两个待预测晶体结构中满足第二预设条件的结合位点或界面进行预设次数的局部叠加微移及扭转;迭代模块用于迭代生成两个待预测晶体结构的多个满足第二预设条件的结合位点或界面;寻找模块用于计算两个待预测晶体结构的多个满足第二预设条件的结合位点或界面的结合自由能,并寻找出结合自由能最低的结合位点及相互排布方式

103.作为一个可选的实施例,本技术实施例中的分析模块
55
具体用于将复合晶体结构转换为拓扑结构;为拓扑结构添加溶液模型

离子模型,以使拓扑结构达到电荷平衡的生理状态;分别在正则系综与等温等压系综中对达到电荷平衡的生理状态的拓扑结构进行分子动力学模拟,直至拓扑结构达到运动平衡状态;分析达到运动平衡状态的拓扑结构中目标结合位点之间的结合状态及相互作用力的强弱

104.关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不再做详细阐述说明

105.图6是本技术实施例示出的电子设备的结构示意图

106.参见图6,电子设备
600
包括存储器
610
和处理器
620。
107.处理器
620
可以是中央处理单元(
central processing unit

cpu
),还可以是其他通用处理器

数字信号处理器 (
digital signal processor

dsp


专用集成电路 (
application specific integrated circuit

asic


现场可编程门阵列 (
field-programmable gate array

fpga
) 或者其他可编程逻辑器件

分立门或者晶体管逻辑器件

分立硬件组件等

通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等

108.存储器
610
可以包括各种类型的存储单元,例如系统内存

只读存储器(
rom
)和永久存储装置

其中,
rom
可以存储处理器
620
或者计算机的其他模块需要的静态数据或者指令

永久存储装置可以是可读写的存储装置

永久存储装置可以是即使计算机断电后也不会失去存储的指令和数据的非易失性存储设备

在一些实施方式中,永久性存储装置采用大容量存储装置(例如磁或光盘

闪存)作为永久存储装置

另外一些实施方式中,永久性存储装置可以是可移除的存储设备(例如软盘

光驱)

系统内存可以是可读写存储设备或者易失性可读写存储设备,例如动态随机访问内存

系统内存可以存储一些或者所有处理器在运行时需要的指令和数据

此外,存储器
610
可以包括任意计算机可读存储媒介的组合,包括各种类型的半导体存储芯片(例如
dram

sram

sdram
,闪存,可编程只读存储器),磁盘和
/
或光盘也可以采用

在一些实施方式中,存储器
610
可以包括可读和
/
或写的可移除的存储设备,例如激光唱片(
cd


只读数字多功能光盘(例如
dvd-rom
,双层
dvd-rom


只读蓝光光盘

超密度光盘

闪存卡(例如
sd

、min sd

、micro-sd
卡等)

磁性软盘等

计算机可读
存储媒介不包含载波和通过无线或有线传输的瞬间电子信号

109.存储器
610
上存储有可执行代码,当可执行代码被处理器
620
处理时,可以使处理器
620
执行上文述及的方法中的部分或全部

110.此外,根据本技术的方法还可以实现为一种计算机程序或计算机程序产品,该计算机程序或计算机程序产品包括用于执行本技术的上述方法中部分或全部步骤的计算机程序代码指令

111.或者,本技术还可以实施为一种计算机可读存储介质(或非暂时性机器可读存储介质或机器可读存储介质),其上存储有可执行代码(或计算机程序或计算机指令代码),当可执行代码(或计算机程序或计算机指令代码)被电子设备(或服务器等)的处理器执行时,使处理器执行根据本技术的上述方法的各个步骤的部分或全部

112.以上已经描述了本技术的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例

在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的

本文中所用术语的选择,旨在最好地解释各实施例的原理

实际应用或对市场中的技术的改进,或者使本技术领域的其他普通技术人员能理解本文披露的各实施例

当前第1页1  
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
网站地图