微信里点“发现”,扫一下
二维码便可将本文分享至朋友圈
演讲摘要:碳水化合物活性酶(CAZymes)在生物能源、人体肠道微生物群、植物病原学研究和工业中具有极其重要的意义。我们建立了CAZyme的深度注释数据库dbCAN-SEQ(http://bcb.unl.edu/dbCAN_seq/)与自动注释服务器dbCAN2 (http://bcb.unl.edu/dbCAN2/)去解决CAZyme基因组挖掘需求。近期,我们进一步开发了一种基于k-mer特征的酶分类、模体识别和基因组注释算法与工具eCAMI(github.com/zhanglabNKU/eCAMI),算法设计了二分图进行特征快速筛选,达到准确的效果。对400左右酶家族的数千个亚家族提取k-mer(亚家族的特征模体),可用于注释酶的新基因组;并推广到EC number概念下的k-mer特征提取与酶EC预测。CAZyme和酶EC数据集实验可知:(i)eCAMI在CAZyme和酶EC分类注释的准确性等方面性能最好;(ii)基于k-mer的工具(包括PPR Hotpep,CUPP和eCAMI)在酶EC预测方面,比基于同源性和深度学习工具表现更好。
讲者简介:南开大学教授,博士生导师,人工智能学院智能工程系主任。从事组学数据分析、机器学习等领域研究。近年来进行异构组学数据分析、蛋白质序列分析、碳水化合物活性酶的生物信息工具与算法等方面研究,主持并承担过国家自然科学基金面上项目、海外及港澳学者合作研究基金等多项课题,以第一作者与通讯作者(含并列)在PNAS、Bioinformatics、Nucleic Acids Research等国际知名期刊发表十余篇学术论文,包括2020 ESI 0.1%热点论文1篇。2009年至2010年为佐治亚大学生物信息研究所博士后,后在莱斯大学、贝勒医学院从事短期合作研究,2018年受邀访问日本理化研究所(RIKEN)、山梨大学。他是中国计算机学会(CCF)生物信息专业委员会专委,中国人工智能学会生物信息与人工生命专业委员会专委,曾担任中国自动化学会青工委常务委员。