分子生成术语
约 760 字大约 3 分钟
2025-05-21
蛋白质靶点
与疾病相关、可被药物调节的整个蛋白质分子
药物的蛋白质靶点是整个蛋白质分子
蛋白质口袋
口袋是指蛋白质分子表面或内部的一个特定三维凹陷、空腔或裂缝,其形状和化学性质适合与配体(如药物分子、天然底物、辅因子等)特异性结合
口袋是这个蛋白质靶点上药物分子能够结合并发挥作用的精确位置
配体
药物的本质是一种配体,可以特异性地结合一个与疾病相关的蛋白质靶点(受体、酶、离子通道等)。通过结合靶点上的特定口袋,调节靶点的功能(激活、抑制、降解等)
关系
一个蛋白质靶点上可能有一个或多个口袋(如活性位点、变构位点等),配体可以选择性地结合到其中一个口袋来调节靶点的功能
蛋白质语言模型 pLM
蛋白质是由氨基酸组成的序列。我们可以将 氨基酸看作是“词汇表”,而一条蛋白质序列就是一篇由这些“词汇”组成的“文章”或“句子”
类似于NLP,通过学习序列的内在规律和模式,pLM 从而能够 理解、预测或生成与蛋白质结构、功能和进化相关的序列信息
这类模型(如ESM, ProtBERT, AlphaFold的序列处理部分)通过在大量蛋白质序列上进行预训练,学习到了氨基酸序列的内在语法和语义,能够 预测给定上下文中可能出现的氨基酸,或评估序列的自然度/似然性
Consistency 一致性
指蛋白质序列与结构的一致性。所给出的氨基酸序列能够自洽地折叠成所期望的三维构象,二者在物理化学和进化层面上互相匹配、不产生冲突
残基 Residue
当氨基酸通过肽键连接形成蛋白质链时,每个氨基酸在多肽链中留下的那一部分就被称为氨基酸残基 (amino acid residue),简称残基 (residue)
在肽键形成后,原来的氨基酸分子不再是完整的了,因为它在连接过程中失去了一些原子(形成了一个水分子)。多肽链中每个氨基酸单元脱去水分子后剩余的部分,就是所谓的“氨基酸残基”或“残基”
Cα
蛋白质中每个氨基酸残基都有一个α-碳原子(C-alpha atom),它是残基骨架的中心原子
使用 Cα 原子之间的距离来衡量残基间的远近是一种常用且计算上相对简单的方法,它能粗略地反映残基在三维空间中的邻近关系
