天天育儿网 > 【科普干货】基于UMI数据标签校正的微生物群落多样性研究

【科普干货】基于UMI数据标签校正的微生物群落多样性研究

时间：2021-01-25 03:31:35

16S rRNA基因是细菌系统分类研究中最常用的分子标记，在进化上具有良好的时钟性质，其序列包含相互间隔的10个保守区和9个可变区，保守区物种间变化不大，而可变区具有属或种的特异性。利用高通量测序技术对16S rRNA基因可变区进行测序，能全面解析样本中的物种组成和对应的丰度信息，因此被广泛应用于微生物群落研究。

然而需要注意的是，当前基于高通量测序的微生物群落多样性研究，都是基于相对定量的方法，即把数据归一化到统一数据量，以每种菌reads数占总reads数的丰度比例来进行量化分析。这种定量方式存在的问题也是显而易见的，由于16S扩增子文库的构建有一个无法回避的过程，那就是PCR扩增。只要存在PCR扩增，就会有重复的产生，而扩增偏好性引发的重复的不均匀性，就是相对丰度不可靠的罪魁祸首。也许你会说，我们可以在生信分析端把重复都去掉，然而现实是这些重复的来源不同，代表的意义也不同，一刀切的去重同样也歪曲了事实，图一列举了微生物群落多样性研究的测序数据中重复的主要来源：

同一种菌不同分子的DNA，序列完全一致

真重复，需保留

建库过程包含多轮PCR，分子的拷贝数被指数放大

假重复，需去除

簇生成过程中，扩增的偏好性使部分序列拷贝数异常增加

图一：测序数据中重复的主要来源

①中重复代表的是同种菌的不同分子，是真实物种丰度的呈现，这种重复需要被保留，而②和③这些重复是由扩增产生的假重复，他的数量不能代表PCR扩增前物种的原始组成，尤其当部分序列存在PCR扩增偏好时，Reads数被人为提高，从而导致定量不准，这些重复是需要去除的。

总的来说，PCR扩增之前的重复需要保留，PCR扩增之后的重复需要去除。怎么实现呢？UMI(Unique Molecular Identifier)数字标签技术这时候就派上用场了，只要在PCR扩增之前给每个分子加上一个特有的标签，之后无论经过多少个循环的扩增，这个标签都一直伴随着同步进行复制，最后可以通过UMI的种类对真重复和假重复进行区分，从而达到去除扩增重复的目的。下图分别展示了常规两步法建库和利用UMI数字标签建库的流程：

图二：16S扩增子建库流程

左，常规两步法建库流程

右，UMI数字标签建库的流程

从上图不难看出，既往基于测序reads数进行微生物群落多样性定量，定量值偏离真实值，在采用了UMI数字标签之后，根据UMI标签的种类进行定量，定量值更接近于真实值，校正了由PCR扩增偏好带来的影响。

UMI数字标签真就如此神奇吗？适用于哪些微生态场景的研究呢？咱们下期再来分享。

END

派森诺生物成立于4月，是一家致力于为健康医学、生命科学等领域提供分子生物学技术服务及大数据挖掘与分析服务的高新技术企业。公司总部位于上海，在南京、香港等地设有多家全资子公司，并拥有当前世界上领先的基因测序平台和大数据计算平台。具有完全自主研发的创新技术和成果，已取得授权及受理发明专利、软件着作权100余项；合作项目论文多次发表在Nature、Lancet等生物科学、医学权威期刊。公司业务覆盖全国，远涉澳洲、欧洲和美洲，并在国内28个省市设立了办事处，与全球700多所高校、300多家医院及600多家科研机构建立了紧密合作关系。派森诺生物始终秉承“解析序列诠释生命”的企业使命，致力于为广大生命科学、医学工作者提供先进的科研及临床应用解决方案。

如果觉得《【科普干货】基于UMI数据标签校正的微生物群落多样性研究》对你有帮助，请点赞、收藏，并留下你的观点哦！

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。