》

数据质控一般采用FastQC(https://www.bioinformatics.babraham.ac.uk/projects/fastqc/)软件运行。
质量控制箱型图:FASTQ文件中每一个位置上的所有read的碱基质量值的箱形图。例如,有25000个read,第一个位置上的base(碱基)就有25000个质量值,这个值画成第一个箱形图。

Per base sequence quality: FASTQ文件中每一个位置上的所有read的碱基质量值的箱形图。上图中左图为高质量数据,右图为低质量数据。
碱基分布图:由于 RNA-seq 所测的序列为随机打断的cDNA片段,因打断的随机性,理论上,G和C、A和T的含量每个测序循环上应分别相等,且整个测序过程稳定不变,呈水平线。

注 Per base sequence content:每个碱基位置上ATGC含量的分布图

比对结果文件(SAM/BAM):将读段比对到参考基因组后,生成标准对齐格式SAM(序列对齐/映射格式)或其压缩二进制版本BAM。BAM文件是基因数据分析中最通用的比对数据存储格式, 需使用专用软件如Samtools软件(Linux系统),或者IGV软件(Windows)系统打开。



定量表达数据标准化(csv/tsv)
5.差异表达分析(differential expression analysis)




GO富集分析示意图(注:用不同的颜色代表不同的类型 红色代表BP(生物学过程) 绿色代表CC(细胞亚定位) 蓝色代表MF(分子功能)纵轴上面是GO条目,横轴为校正之后的P值。)


共表达举例分析软件:WGCNA、Mfuzz

《文章来源于微信公众号:生物智能洞察》
新疆昭苏马科技小院
培养单位:新疆农业大学
联合培养单位:昭苏县西域马业有限责任公司
版权所有 全国农业专业学位研究生教育指导委员会 版权所有 Copyright © All Rights Resserved 京ICP备 05004632号-3
》

数据质控一般采用FastQC(https://www.bioinformatics.babraham.ac.uk/projects/fastqc/)软件运行。
质量控制箱型图:FASTQ文件中每一个位置上的所有read的碱基质量值的箱形图。例如,有25000个read,第一个位置上的base(碱基)就有25000个质量值,这个值画成第一个箱形图。

Per base sequence quality: FASTQ文件中每一个位置上的所有read的碱基质量值的箱形图。上图中左图为高质量数据,右图为低质量数据。
碱基分布图:由于 RNA-seq 所测的序列为随机打断的cDNA片段,因打断的随机性,理论上,G和C、A和T的含量每个测序循环上应分别相等,且整个测序过程稳定不变,呈水平线。

注 Per base sequence content:每个碱基位置上ATGC含量的分布图

比对结果文件(SAM/BAM):将读段比对到参考基因组后,生成标准对齐格式SAM(序列对齐/映射格式)或其压缩二进制版本BAM。BAM文件是基因数据分析中最通用的比对数据存储格式, 需使用专用软件如Samtools软件(Linux系统),或者IGV软件(Windows)系统打开。



定量表达数据标准化(csv/tsv)
5.差异表达分析(differential expression analysis)




GO富集分析示意图(注:用不同的颜色代表不同的类型 红色代表BP(生物学过程) 绿色代表CC(细胞亚定位) 蓝色代表MF(分子功能)纵轴上面是GO条目,横轴为校正之后的P值。)


共表达举例分析软件:WGCNA、Mfuzz

《文章来源于微信公众号:生物智能洞察》
版权所有 全国农业专业学位研究生教育指导委员会
版权所有 Copyright © All Rights Resserved
京ICP备 05004632号-3