安恒信息范渊在乌镇峰会谈AI:以工具视之、以工具用之、以工具治理之诺基亚与微软再合作,为 Azure 数据中心供货延长五年天岳先进发布业界首款 300mm(12 英寸)N 型碳化硅衬底三星介绍内部安全团队 Project Infinity 攻防演练项目,高效修复 Galaxy 手机平板漏洞上海市将推进低空飞行服务管理能力建设,2027 年底前累计划设相应航线不少于 400 条岁末,海尔给您备好一套“小红花”为什么说Q10K Pro是今年最值得入手的电视?看完这几点就明白了!“小墨方·大不凡”!Brother“小墨方”系列彩喷一体机全新上市黄仁勋:AI智能需求强劲,“物理定律”限制英伟达芯片增长诺基亚与微软再合作,为Azure数据中心供货延长五年国家数据局:到2029年基本建成国家数据基础设施主体结构中国已发展成为全球最大的互联网市场,拥有全球最多的网民和移动互联网用户中国铁塔:计划按照10:1的比例合股美国FCC正式划定5.9GHz频段用于C-V2X技术在AI领域奋起直追!苹果要对Siri大革新 2026年正式发布日本机构公布量子专利榜单:本源量子、国盾量子位居全球第1中国联通:拟向华为、中兴展开5G网络设备竞争性谈判采购京东“先人一步”预约OPPO Reno13系列 1元锁定腾讯视频VIP会员季卡万兆光网中国行:以应用为牵引,上海万兆加速启航消息称芯片制造商铠侠12月18日上市,将通过IPO筹资总计700亿日元
  • 首页 > 云计算频道 > 云计算

    行业应用|基于超算的环境宏基因组数据分析平台

    2023年09月16日 10:31:19   来源:中文科技资讯

      本文内容整理自:中国科学院生态环境研究中心助理研究员 王东麟老师在第四届“氮素生物地球化学循环”学术论坛的报告实录

      随着大家对生命未知领域的探索,越来越多的需要依靠测序技术对生物的过程、代谢的特性进行解析。尤其是现在广泛利用的二代测序技术,也是基于短序列的测序方式,它能够以一种较高性价比的方式,给广大的科研工作者以及实际的生产过程中的工作人员,提供非常有用的信息。

      这种测序技术需要我们对生物学过程,包括对计算机代码有些理解的基础,其中会包含一些生物信息学领域的专属名词,甚至会要求具备编程基础。这也造成了大家对环境宏基因组的分析过程上手难度的增加。宏基因组的测序量,一般在6~10GB+,往往带来的是对计算成本,尤其是计算时长高的消耗。基于北京超级云计算中心(以下简称北京超算)的算力资源和平台,我们搭建了能够对环境宏基因组数据进行分析的软件和平台,在这个平台上能实现群落功能的分析,并且整合了宏基因组分箱技术,以及基于深度学习的病毒组分析。

      1Tb的数据大约100个样本,每个样本测序深度在10个G左右。单纯使用服务器进行分析大约需要150天,在基于北京超算搭建的宏基因组数据分析平台上进行计算,7-20天之内就可以完成数据分析,大大的节约了时间成本和计算费用成本。

      北京超算能够提供非常强的硬件支持,满足计算需求的同时提供7X24小时的专属客服支持。近几年来通过与北京超算的合作达成了一些论文计算的分析过程,并发表了一些文章。

      案例1 湿地植物根际锰氧化物强化氨氧化过程

      在解析锰氧化过程中,利用宏基因组分析平台,发现锰氧化过程和氨氧化过程存在耦合作用。锰氧化的过程中其实缺乏在湿地中的探索,我们在全国各个城市进行湿地样本收集。对根际土和非根际土进行宏基因组测序,以及常规的理化指标的测定。

      可以看到,宏基因组的测序量大约是3.7个TB。19年底到20年上半年,我的整个服务器都在跑这个数据还没有跑完。在开发了基于超算的计算流程和计算软件后,两个月内完成了所有的计算任务。简单分享一下我计算的成果。

    image.png

      我发现在芦苇根际中锰氧化物的丰度含量比较高。锰氧化主要是微生物(介导)的,所以我就好奇这个过程中到底有没有锰氧化基因有一个富集呢。基因的丰度是通过宏基因测序,然后加上计算获得的。我在对它进行不同分类比较的时候发现,根际和非根际锰氧化基因的组成类型其实是不一样的,植物根际可以显著的富集几种类型的锰氧化基因。

      除此之外,湿地植物的根际核心微生物和锰氧化的含量,有些微生物是和它呈正相关的,有些是呈负相关的。正负相关的这些微生物中,最明显的功能上的区别在于:正相关的这些微生物中有一部分是能够执行氨氧化过程的。同样的,在人工湿地中我们发现了锰氧化物和铁氧化物都是微生物群落结构关键的驱动因子,同时,锰氧化物的含量和氨氮浓度之间呈非常显著的正相关性。大家都知道氨氧化很大程度上是由微生物(介导)的,尤其是在人工湿地水处理的过程中。在锰的氧化过程中,锰氧化物起到了非常关键的作用。它们二者之间到底有没有比较强的关联性呢?在生物学角度,我们对锰氧化基因和氨氧化基因之间进行了线性的回归分析,分析发现它们两个之间有非常强的线性关系。是不是别的氮转化的过程也和锰氧化的基因有这样的相关性呢?我们把剩下的一些氮转化过程的关键基因与锰氧化基因进行了关联分析,发现除了氨氧化基因,别的氮转化基因并没有和锰氧化基因形成显著的线性相关性。

      我们又通过自建amoA的数据库,把执行氨氧化过程的微生物分成氨氧化古菌、氨氧化细菌和完全氨氧化菌。通过比较分析,我们发现人工湿地中常规的水处理环境中,完全氨氧化菌的比重比较高,高于常规的氨氧化细菌,并且锰氧化基因的丰度也与完全氨氧化菌之间呈正相关性。

      对环境的解析过程,最主要的目的之一是为了把它更好的应用于污染治理过程中,在河北省晋州市龙门村,我们搭建了一个人工湿地的中试装置。面向当地农村的生活污水,我们在一些人工湿地中人为的向其中加入锰砂,即锰氧化物。我们发现加入的这部分锰氧化物可以提升氨氮的去除负荷,同时amoA的丰度也是得到了非常强的提升。

      从自然发展到人为干预污染去除的过程中,由于前期使用超算获得微生物相关的数据,大大节省了分析的时间,有效提升了效率。

      案例2 饮用水快速滤池完全氨氧化过程

      在另一个水处理的环境中,我们考察了饮用水的快速砂滤池,在这个工程水处理的装置中微生物的一些过程。同样,我们对它进行了采样和测序,数据集大约是1个TB的测序深度。同样在过程中,我们发现氨氮转化比较好,而且和amoA的基因丰度也形成比较线性的关系。通过数据库比对分析发现,其中完全氨氧化菌起到了非常关键和重要的作用。它和锰的转化,锰氧化基因的转化过程,一同协同对整个砂滤池中的污染物形成了降解。

    image.png

      利用基于北京超算开发的宏基因组数据分析平台,能够快速的提取其中的微生物信息,并对病毒数据进行分析,解析水环境中相对完整的相互作用的网络;通过开发基于AI深度学习的算法,能够对噬菌体形成非常好的识别,包括对宿主的预测。

      北京超算AI智算云平台可以提供非常丰富的GPU的计算资源,科研工作者无需自建资源即可完成建模任务,帮助没有深度学习经验的同学实现对病毒的解析。

    image.png

      (报告现场)

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    [No. H001]
    分享到微信

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。