天天动画片 > 八卦谈 > 通过4个步骤,入门生物信息学分析

通过4个步骤,入门生物信息学分析

八卦谈 佚名 2022-08-11 17:32:52

二十一世纪是生物的世纪,该观点已提出多年。
甚至有人提出,这句话的真正含义应该是“二十一世纪在各行各业都能找到曾经学生物的人”。
对此,我们不再做进一步推敲。

但可以看出的是,越来越多人已经投身于生物相关研究了。


▽  生物信息学分析入门


生物信息学(Bioinformatics)是研究生物信息的采集、处理、存储、传播,分析和解释等各方面的学科,以信息技术及其相关的手段对生物问题进行探索研究。

生物信息学,信息是手段,生物是核心。

生物信息学分析,目前主要用于肿瘤类疾病的研究。

想尽快领悟生信分析领域,需要从2方面着手准备:文章套路、数据复现。

所谓文章套路,即解读文章时应从宏观思维出发,能理解文章的逻辑思维。

而数据复现,则是对文章结构有所了解后,能进行模块化拆解还原,即可以复现出所有模块的数据。

理解了文章套路,复现出文章数据,才在一定程度上掌握了文章的技能。


▽  生信研究四大模块

生信分析研究最主要的思想可概括为:挑、圈、联、靠。


挑(分子):筛选出和疾病相关的差异表达分子。

圈(功能):对筛出的差异表达分子进行标签化、归纳和分类,如GO及KEGG分析。

联(关系):进行分子与分子间、或信号通路和信号通路之间的连接,如PPI分析。

靠(临床):是否与临床表征有明确的关联,如PFS、OS等。


生信分析主要模块内容及相关分析工具如下所示。

图片


以上只是给出了生信分析的主要关键点,并非一成不变。

在具体的生信分析中,需要根据实际情况做相关的逻辑组织。


▽  生信分析实例

看到这儿,大家肯定还是有点迷茫。

接下来会给出一个生信分析的具体实例,看完大致就可知道生信分析在做什么了。

01. 挑分子


图片

上图是国内学者2021年发表于期刊OncoTargets and Therapy的生信相关文献。

题名:Identification of HOXD10 as a Marker of Poor Prognosis in Glioblastoma Multiforme (HOXD10为多形性胶质母细胞瘤预后不良的标志物)

需要注意的是,在开始具体分析之前,此论文作者已通过前期筛选,得到了一个与母细胞瘤疾病发展相关的关键分子(HOXD10),即已完成了生信分析的第一步:挑分子。


02. 靠临床

针对该研究,作者首先证明,HOXD10在肿瘤组织中的表达高于正常组织(A)。

图片


随后作者利用不同来源(TCGA、CGGA、GEO)的数据,通过生存分析证明了HOXD10表达水平影响患者的生存时间。

该部分通过表达分析和预后分析,阐明了HOXD10与肿瘤的发生发展相关。

作者首先证明,研究的分子具有临床意义,是具有解决临床问题的潜在价值的,值得后续做更深层次的研究。

这部分,实现了“靠临床”。

图片

随后作者又通过单因素COX回归分析,探索了不同临床特征下(是否全切除、是否TMZ治疗、是否放疗、IDH1状态、HOXD10状态),HOXD10对预后的影响(A-E)。

又通过多因素COX回归分析,探索了影响患者生存的独立预后因子(表2)。

此部分,作者仍然是做“靠临床”的分析。


03. 圈功能

前面通过各种分析论证了HOXD10影响疾病发展,接下来作者探讨了HOXD10参与肿瘤发生发展可能的作用机制。


图片

作者先筛选出母细胞瘤中与HOXD10表达模式相似的一群差异基因(A)。

随后通过富集分析探索了这群基因可能参与的生物学过程、发挥的分子功能(B),及其涉及的信号通路(C)。

可以看到,这群基因主要与细胞因子-细胞因子受体相互作用通路相关。

该部分,作者进行了“圈功能”的分析。


04. 联关系

图片


最后,作者通过蛋白-蛋白互作(PPI)网络,呈现了这群分子之间的相互作用形式。

该部分,作者进行了“联关系”的分析。


图片


作者虽然不是完全按照“挑、圈、联、靠”的过程进行内容整合,但生信分析的精髓可是面面俱到啊。

这也充分说明了生信分析的灵活性,给足了我们自由发挥的空间,说“一千个人一千个哈姆雷特”也不为过。

图片


在这里我们只呈现了部分简单结果,主要展示了生信分析的4大节点。

该研究还有很多其他精彩的部分在此不再做过多分析,感兴趣的小伙伴可以自行阅读深究。

相信现在的你,心里又有一个不解之谜了。那就是:这个分子是怎么找到的?我要是有这个分子,我也会生存分析、COX回归对不对?

图片


可是问题又来了,即使找到了这个分子,可是要分析,那数据又从何而来呢?
一波掀起千层浪。

既然看明白了文章套路,就需要研究如何找分子、数据从何下载、如何下载、数据如何处理、

用什么统计分析方法、如何分析等问题,这就进阶到了数据复现
我们会针对相关问题,后续不断进行更新。

若有疑问,或想要了解某个方面的信息,都可以给我们留言。

图片


本文标题:通过4个步骤,入门生物信息学分析 - 八卦谈
本文地址:www.ttdhp.com/article/2956.html

天天动画片声明:登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。
扫码关注我们