MicroRNA/lncRNA分析

microRNA-seq分析流程

首先,将从miRbase获得的人类的microRNA的成熟体序列比对到相对应的前体序列,以确定microRNA前体上的成熟体序列。

       然后,将测序的reads比对到前体序列,统计落到成熟体上游2nt到下游5nt之间的reads数量,以确定microRNA的表达。最终,以成熟体为单位计算microRNA的表达。

比对使用bowtie软件,将成熟体比对到前体时,不允许有错配; 将reads比对到前体时,允许一个错配。

采用TMM(Trimmed Mean of M values),DESeq,FQ(full quantile)进行样本之间的标准化。

Case-control用R 的DESeq package 求差异表达的P-value,取多重检验校正后的P-value<0.05 的基因作为差异表达基因。


上图为reads比对到特定miRNA的情况,以及该miRNA的结构。


预测miRNA靶标基因与位点

用于预测miRNA目标位点的工具有:TargetScan, miRanda, PicTar,Microcosm, microT-ANN, miRDB, Mirgen。

上图为Targetscan预测的miRNA的目标基因的结合位点。


通过对miRNA靶基因的分析,可以构建miRNA-靶基因的作用网络,形象的展示最为重要的miRNA以及其调控的基因。

上图是miRNA与靶基因间的关系图,菱形节点为miRNA,圆形节点为靶基因。


long non-coding RNA(lncRNA)sequence分析

随着测序技术的不断成熟,lncRNA的注释也不断完善,利用已知的数据库中的noncoding RNA 的信息 (Refseq,GENCODE 和UCSC),可以很方便的找到测序数据中的lncRNA。

lncRNA在生物体中起到重要的调控作用,因此lncRNA与coding基因的表达相关性,以及lncRNA与相邻的两个coding基因的相关性,可以提供研究lncRNA调控的线索,为后期的研究提供思路。