[Metagenome-1] Metagenomic Data analysis–summary

研究人员利用该技术,进一步对人体共生微生物和海洋生物表面附生微生物群落开展了研究。从实际数据分析结果来看,RiboFR-seq方法可以实现对宏基因组中16S
rRNA拷贝数的测定,从而修正了由于16S
rRNA拷贝数差异导致的菌群丰度估计偏差,所得到的菌群组成更能反映环境中的真实情况。此外,利用“桥连序列”信息,对16S扩增子和全基因组测序拼接结果进行重新注释,可辅助宏基因组数据的拼接和组装。本技术首次建立了宏基因组中物种谱和功能基因谱的有效关联,为宏基因组学研究尤其是未知环境条件下微生物组的研究,提供了全新的思路和方法。

 宏基因组(metagenomics)

宏基因组学(Metagenomics)也称为元基因组学,是以样品中的微生物群落作为整体进行研究的学科。自然界中约有99%的微生物是不能在实验室条件下进行纯化培养的。宏基因组学研究不要求对每个微生物进行分离纯化培养,而是直接从样品中提取基因组DNA后进行测序分析。通过宏基因组测序,能够解释微生物群落多样性、种群结构、进化关系、功能活性及环境之间的相互协作关系,极大地扩展了微生物学研究范围。

目前宏基因组测序可以分为环境微生物多样性检测和宏基因组de
novo测序。其中环境微生物多样性检测是指通过对环境中微生物16S
rDNA高变区/ITS
的PCR扩增产物进行高通量测序,分析该环境下微生物群落的多样性和分布规律。宏基因组de
novo测序是指对环境样品中所有微生物基因组DNA片段化后进行高通量测序,然后进行序列组装和基因注释,获得部分不可纯培养微生物的基因组序列,分析该环境下所有微生物基因集信息。

广义的metagenomics包括宏基因组测序和扩增子16S测序。16S测序相比宏基因组测序来说,价格更加便宜。利用16S技术对大量样本进行测序分析后,首先发现并阐明不同条件的样本间微生物组成以及多样性差异,然后挑选个别有代表性的样本,进行宏基因组测序,从而可以验证16S的分析结论、更加深入的阐明群落的功能情况,更好地说明微生物群落与环境之间的关系。可以简单的理解为,16S是指测了一部分的基因组的宏基因组。

宏基因组:宏基因组测序是指对微生物群体进行高通量测序(我的理解是因为很多情况下,微生物群落很难分离,所以只能一堆微生物一起拿来测序分析了),分析特定环境中微生物群体基因组成及功能、微生物群体的多样性与丰度,进而分析微生物与环境、微生物与宿主之间的关系,发现具有特定功能的基因。宏基因组测序无需分离纯培养微生物,较大扩展了微生物资源的利用,为环境微生物群落的研究提供了有效工具。宏基因组深度测序可以揭示或估计环境中真实的物种多样性和遗传多样性,挖掘具有应用价值的基因资源,应用于开发新的微生物活性物质。宏基因组研究分两个方向:扩增子测序和全基因组测序。

扩增子:扩增子(amplicon)为DNA或RNA扩增后的一段核苷酸序列。比如通过PCR扩增得到的某个基因的扩增片段。更简单的说,经过人工扩增的DNA片段或RNA片段、扩增产物。

扩增子测序,涉及特定序列位点的PCR扩增,通常是16S/18S
rDNA。宏基因组的物种分类,一般用OUT(operational taxonomic
unit),即可操作单元来表示。通常原生生物使用16S
rDNA来衡量,真核生物的OUT使用18S
rDNA来衡量。我的理解是,选取一段特别的DNA片段来测序,这段DNA还可以区分不同的菌落

为什么用16S,而不是其他15S或者17S呢

16SrRNA为核糖体的RNA的一个亚基,16SrDNA就是编码该亚基的基因。细菌rRNA(核糖体RNA)按沉降系数分为3种,分别为5S、16S和23S
rRNA。16S rDNA是细菌染色体上编码
rRNA相对应的DNA序列,存在于所有细菌染色体基因中。16SrDNA是细菌的系统分类研究中最有用的和最常用的分子钟,其种类少,含量大(约占细菌RNA含量的80%),分子大小适中,存在于所有的生物中,其进化具有良好的时钟性质,在结构与功能上具有高度的保守性,素有“细菌化石”之称。在大多数原核生物中rDNA都具有多个拷贝,5S、16S、23S
rDNA的拷贝数相同。16S
rDNA由于大小适中,约1.5Kb左右,既能体现不同菌属之间的差异,又能利用测序技术较容易地得到其序列,故被细菌学家和分类学家接受。

沉降系数:沉降系数(sedimentation
coefficient)用离心法时,大分子沉降速度的量度,等于每单位离心场的速度。或s=v/(ω^2*r)。s是沉降系数,ω是离心转子的角速度(弧度/秒),r是到旋转中心的距离,v是沉降速度。沉降系数以每单位重力的沉降时间表示,并且通常为1~200×10的-13次方秒范围,10的-13次方这个因子叫做沉降单位s,即1s=10^-13秒,沉降系数对于生物大分子来说,多数在(1~500)×10^-13秒之间,如血红蛋白的沉降系数约为4×10的-13次方秒或4s。

人类宏基因组

关于人类健康问题,
宏基因组对于诊断,噬菌体分型,毒力和抗生素耐药性检测扮演着重要的角色,对于新疫苗和培养基的开发也有重要作用。综合分析复杂的微生物群落,无论是共生还是病理上的,都能够帮助我们更好的理解和管理人类疾病,比如肥胖。提高对于阴道,胃肠道,皮肤和呼吸道系统微生物的理解,可以帮助我们更好的理解在微生物群落直接影响宿主的健康。
宏基因组学测序可以被帮助分子标记的的鉴定,人类微生物群体的个体差异也对于将来的治疗以后建立个人药物库。

图片 1

流程(workflow)

二代测序的宏基因组分析涉及几个分开的流程。
1.第一步:样品总DNA提取;
2.第二步:片段化,接头连接;
3.第三步:序列组装成contigs;
4.第四步:基因组binning(用于重构完整基因组);
5.比对到最近的分类单元;
6.ORF预测以及相关基因功能的注释。

图片 2

论文链接

宏基因组数据分析

宏基因组,和metataxonomics(16s rRNA
analysis),是使用全基因组测序技术来研究特定环境下的所有的微生物种类及含量的方法。这个方法对于阐释宿主相关的微生物组成和宿主表型非常有用。宏基因组对于酶和生物催化剂提供了有价值的分子视角。
应用-宏基因组测序的优势:

  • 无偏向结果不受特异的基因组位点的影响
  • 分类学的独立遗传标记
  • 能够研究高度变异的微生物,比如病毒
  • 微生物多样性评估
  • 检测各种环境微生物的丰度
  • 分析不可以培养的微生物
  • 功能基因和基因聚类的研究

相关文章

Comment ()
评论是一种美德,说点什么吧,否则我会恨你的。。。