【基于质谱的分析方法联用对”代谢组学”进行研究】
代谢组学”研究可分为:“发现代谢组学”和“靶标代谢组学”,两者共同组成了“代谢组学”研究的“生态系统”。本文将介绍基于质谱的分析方法联合统计学分析法对“代谢组学”进行研究。质谱能在一个广泛的动态范围内保持极高的检测灵敏度、高度的稳定性、重现性,为“靶标代谢组学”检测提供了技术保障,而统计学方法可以高效地从大量试验样本中对比并可视化差异化表达的代谢产物的实验数据,对于发现和鉴定生物标志物具有重要的意义。
“代谢组学”是研究生命体中所有代谢产物(小分子化合物)变化规律的科学,通过比较实验组和对照组中内源性代谢产物的系统性差异来研究生命现象,并揭示其内在规律。这些“代谢组”水平上的差异与生物体在生理、病理、营养、用药等各种生命过程紧密相关,是生物学过程执行后的最终产物的集合,因而也是各种组学研究中最接近生物表型的一种组学。“代谢组学”是一种典型的用化学手段研究生命科学的组学,从而研究生命的化学基础。熟悉“中心法则”的研究者都能体会图1中所展示的“系统生物学”研究思维。
图1.“代谢组学”与“基因组学”、“转录组学”以及“蛋白质组学”的关系。
从图1的解读中不难理解,“代谢组学”对研究生命科学是何等重要。有人说“基因组学”是研究“可能发生”哪些生命过程;“转录组学”是研究“准备发生”哪些生命过程;“蛋白质组学”是研究“正在发生”哪些生命过程;而“代谢组学”则是研究已经发生了哪些生命过程:因而“代谢组学”最确切地体现了生命过程发生的结果,在疾病诊断、药物研发、环境科学、食品安全、生物农业、生物能源等方面都发挥着重要作用(图2)。
图2.“代谢组学”的一些典型应用领域。
“代谢组学”研究可分为两类:“发现代谢组学”(也称“非靶标代谢组学”)和“靶标代谢组学”。“发现代谢组学”的目的是研究实验组和对照组中有哪些代谢产物有统计学意义上的显著差异,更多的是从定性和半定量角度发现“代谢组”上的差异,并对具有显著差异的化合物进行化学结构鉴定。
“靶标代谢组学”的目的则是定量验证特定代谢产物的表达差异。“靶标代谢组学”的研究
对象是确定的一种或几种代谢产物,并用大量的试验样本进行验证,由于要进行定量研究,有可能会使用内标来制定标准曲线(绝对定量)。“发现代谢组学”与“靶标代谢组学”相辅
相成,从“发现”到“验证”,从“无假设”到“假设驱动”,共同组成了“代谢组学”研究的“生态系统”。
硬件部分
“代谢组学”的主流研究工具有气相色谱/质谱联用(GC/MS),液相色谱/质谱联用(LC/MS)以及核磁共振技术(NMR)。对于“发现代谢组学”,GC/MS和能获取化合物精确质量数的高分辨LC/TOF(液相色谱/飞行时间质谱)以及不仅能获取化合物精确质量数,同时还能获取其二级谱图的LC/QTOF(液相色谱/四级杆串联飞行时间质谱),特别是带有iFunnel(离子漏斗)技术的高灵敏度LC/QTOF是最优选择。
毛细管电泳质谱联用(如CE-TOF或CE-QTOF)也是“发现代谢组学”中重要的研究工具。非极性(或极性弱)的化合物往往用GC更加容易分离,这类化合物因而也常适用于GC/MS分析;而极性强的化合物则更加适合与LC/TOF或LC/QTOF分析;一些离子化的化合物用CE分离会更加容易,因而适合于CE/TOF或CE/QTOF的分析。同一份生物样本中往往既有非极性(或极性弱)的化合物,也有极性强的化合物和离子化的化合物,因而上述GC/MS、LC/MS和CE/MS等基于质谱的分析方法联合使用可以最大程度提高代谢物检测的覆盖率。
“发现代谢组学”的实验流程用图3来展示:从样本处理,到分离、检测、分子特征提取、统计学分析、代谢物鉴定以及信号通路分析、生物学意义解释等。对于“靶标代谢组学”,往往使用GC/MS和LC/QQQ(液相色谱/三重串联四级杆质谱)进行分析,这类质谱能在一个广泛的动态范围内保持极高的检测灵敏度,其高度的稳定性和重现性为“靶标代谢组学”检测提供了技术保障。
图3.“发现代谢组学”的实验流程。
“靶标代谢组学”的实验流程用图4来展示:从样本处理,到分离、检测、MRM(多反应监测)定量、统计学分析以及信号通路分析、生物学意义解释等。相对于质谱技术,核磁共振技术进行代谢组学研究的优势在于样品制备过程更加简单,并能快速地提供未知化合物的结构和定量信息。可以处理的生物样本也更为广泛,从液体、胶体到固体组织都可以进行分析。但是,其灵敏度却比质谱技术要低几个数量级,所以只能对代谢物含量至少在微摩尔级的代谢物进行检测。
图4.“靶标代谢组学”的实验流程。
图5.核磁共振波谱仪。
统计学分析、代谢物分子结构鉴定和生物学意义解析是“代谢组学”研究的重点和难点,而
这些问题的解决不仅仅决定于高性能的硬件,更和功能强大的软件密切相关。
由于代谢产物的变化相对于基因表达和蛋白质表达而言,更加多变,受到环境、营养等各种状况的影响,因而,无论是“发现代谢组学”还是“靶标代谢组学”,统计学分析都显得更为重要,Mass Profiler Professional(MPP)这款软件集成了各种统计学分析方法,可以高效地从大量试验样本中对比并可视化差异化表达的代谢产物的实验数据,以便发现具有统计学意义的差异化表达特征,这对于发现和鉴定生物标志物具有重要的意义。在该软件中,统计学差异可以通过 ANOVA、PCA、clustering、volcano plot、hierarchical clustering、class predictions或者自行编写R scripts来实现。
快速、高通量、方便地进行代谢物分子结构的鉴定取决于优秀的代谢产物数据库和谱库,全球最著名的商用化数据库/谱库资源有:
Fiehn GC/MS Metabolomics Library,由美国UC Davis的著名科学家Dr. Oliver Fiehn Lab开发,包含超过700种代谢产物的基于GC/MS技术的数据库和谱库。
METLIN Personal compound database and library,METLIN是美国The Scripps Research Institute著名科学家Dr. Gary Siuzdak Lab开发的基于LC/MS技术的数据库和谱库,涵盖超过2万7千种化合物,包含超过8千中脂质体。
生物学意义的阐释对于利用“代谢组学”技术进行生命科学研究、生物标志物的发现等都具
有关键意义,而将经过了统计学分析和代谢物鉴定的内源性代谢产物在相关物种的信号通路的进行综合分析成为了行之有效的手段,Mass Profiler Professional(MPP)可以访问全球主要的信号通路数据库,如KEGG和WikiPathway数据库,并将代谢组学实验数据在检索到的信号通路中进行整合和显示。同时,也会展示其与相关基因、蛋白以及其他代谢产物的网络关系(图6)。这将有利于其生物学意义的阐释。
图6.“代谢组学”中信号通路分析以及展示与相关基因、蛋白以及其他代谢产物的网络关系。
“代谢组学”研究涉及到严谨的技术和方法,受篇幅所限,本文仅能管中窥豹地浅谈其研
究手段,这是正在兴起的生命科学研究的新领域,在不久的未来,必将对生命科学研究和相关产业产生深远的影响。
安捷伦科技(中国)有限公司
展源
何发
2021-03-19
2021-09-03
2021-08-06
2020-05-27
2021-10-09
2021-03-26
2022-12-26
2021-06-07
2021-01-12
加载更多