全基因组选择(Genomic selection, GS)是一种利用覆盖全基因组的高密度标记进行选择育种的新方法,简言之就是在全基因组范围内的标记辅助选择。全基因组选择作为新一代的育种技术,通过构建预测模型,根据全基因组估计育种值进行早期个体的预测和选择,从而缩短育种世代间隔,加快育种进程,节约成本,推动现代育种向精准化和高效化方向发展。统计模型作为全基因组选择的核心,极大地影响着全基因组预测的准确度和效率。传统预测方法基于线性回归模型,难以捕捉基因型和表型间的复杂关系。相较于传统模型,非线性模型具备分析复杂非加性效应的能力,机器学习(Machine Learning,ML)和深度学习(Deep Learning,DL)算法为解决大数据分析和高性能并行运算等难题提供了新的契机,因此,基于机器学习算法的全基因组选择将会进一步提高选择的预测能力。
近年来,中国农业科学院作物科学研究所/国家南繁研究院大数据智能设计育种创新团队在团队首席、博士生导师李慧慧研究员的带领下,联合多家单位开发出利用植物海量多组学数据进行全基因组预测的深度学习方法(Deep Neural Network for Genomic Prediction, DNNGP),实现了育种大数据的高效整合与利用,助力了深度学习在全基因组选择中的应用,为智能设计育种及平台构建提供了有效工具,相关成果在线发表于《Molecular Plant》。
本次课程,我们诚邀李慧慧老师为我们系统讲解全基因组选择的理论知识并带我们进行详细的实操演练,李老师对课程体系做了精心设计,涵盖了经典统计(GBLUP、RRBLUP)模型、贝叶斯模型和基于机器学习算法的全基因组选择模型(SVM、KRR、RF、XGBoost、GBDT、LightGBM),对每一个模型都进行详细的预测演示和交叉验证结果评价并实现预测结果的可视化,在此基础上,李老师会进一步带我们学习基于深度学习算法的DNNGP方法及软件操作和KNIME平台的使用方法,最终让大家能够在KNIME平台上实现基于机器学习算法的全基因组预测。课时三天,干货满满,相信将为您呈现一场全基因组选择的视听盛宴。
现将培训有关事项通知如下:
一、主办单位
北京金智研生物科技有限公司
二、主讲专家
李慧慧,研究员,博士生导师,中国农科院大数据智能设计育种创新团队首席科学家。自2005年以来一直致力于作物数量遗传学研究,围绕数量性状遗传解析方法及育种应用,研制了系列方法和软件工具,在国内外多个科研及育种单位广泛应用。在Molecular Plant, Nature Plants, Molecular Ecology, Trends in Plant Science等期刊发表第一/通讯作者37篇,其中单篇他引超过500次的论文3篇,单篇他引超过100次的论文9篇。获国家基金委优秀青年科学基金项目资助,获中国农学会青年科技奖,并入选中国农科院“农科英才”领军人才。担任农学国际主流期刊Frontiers in Plant Science分刊主编,Theoretical and Applied Genetics, Journal of Integrative Agriculture (JIA) 和《作物学报》编委,中国作物学会智慧农业专业委员会秘书长。
张昊,从事农业育种领域大数据以及深度学习软件工具研发等方向的研究,新型农业基因选择工具DNNGP的主要维护人员。
余廷熙,研究方向为机器学习,智慧育种,在线发表学术论文三篇(其中SCI收录一篇,EI检索两篇),并申请软件著作权一项。
三、培训内容
在系统讲解全基因组选择理论知识的基础上,对经典统计(GBLUP、RRBLUP)模型、贝叶斯模型和基于机器学习算法的全基因组选择模型(SVM、KRR、RF、XGBoost、GBDT、LightGBM)进行详细的预测演示和交叉验证结果评价并实现预测结果的可视化,并进一步学习基于深度学习算法的DNNGP方法及软件操作和KNIME平台的使用方法,最终让大家能够在KNIME平台上实现基于机器学习算法的全基因组预测。(详细培训内容及日程安排附后)。
四、培训时间
2023年6月9—11日。
五、培训形式
腾讯会议线上直播,课程免费回放三个月(自课程结束之日起算)。
六、报名方式
扫描或长按识别下方二维码,填写报名信息,提交并支付汇款,即为报名成功,报名截止于2023年6月8日17:00,届时报名通道将自动关闭。
七、报名费用及交费方式
学时3天,3200元/人(包含3个月的视频回放)。
优惠活动:1. 三人成团,团购价2900元/人;2. 早鸟优惠,5月16日之前报名并交费可尊享3000元/人。两项优惠不可叠加使用。
1. 转账汇款
收款单位:北京金智研生物科技有限公司
开户银行:中国工商银行股份有限公司北京中海凯旋支行
账号:0200205009200045825
2. 个人扫码支付
对于不能及时由单位转账的学员,可接受个人垫付的形式,我们在收到报名费后,会及时为您开具发票协助办理报销事宜。扫描下方二维码(支持公务卡、银联卡、信用卡)即可完成支付。如需联系,请致电或微信:15210096658。
温馨提示:汇款时请备注“姓名+全基因组选择”
八、联系方式
杨先生:15210096658
于先生:18310225182,010-88608002
北京金智研生物科技有限公司
2023年4月20日
2023《全基因组选择》日程安排
日期 | 上午8:30-11:30 | 下午14:00-17:00 |
6月9日 星期五 | 经典统计模型理论 | 实操课 |
Ÿ 统计基础知识介绍 Ÿ 全基因组选择介绍 Ÿ 经典统计GBLUP,RRBLUP和贝叶斯模型介绍 Ÿ 交叉验证及模型评价 | Ÿ Excel函数操作 Ÿ R语言环境搭建 Ÿ 基因型数据清洗 Ÿ 群体结构、亲缘关系构建 Ÿ 经典统计模型预测演示 Ÿ BGLR软件包演示 |
6月10日 星期六 | 机器学习理论 | 实操课 |
Ÿ 机器学习基本原理 Ÿ 深度学习基本原理 Ÿ 基于机器学习算法的全基因组预测流程 Ÿ SVM,KRR,RF,XGBoost,GBDT及LightGBM模型介绍 | Ÿ Python环境搭建 Ÿ Jupyter Notebook配置及基本操作讲解 Ÿ SVM,KRR,RF,XGBoost,GBDT及LightGBM模型预测演示 Ÿ 交叉验证结果评价 Ÿ 预测结果可视化 |
6月11日 星期日 | 全基因组选择软件实操 | 基于KNIME的基因组预测实操 |
Ÿ DNNGP 3.0版本演示 Ÿ SAHTP软件演示 Ÿ Hapmap Toolkits软件演示 | Ÿ KNIME平台讲解及安装 Ÿ 基于KNIME平台实现机器学习全基因组预测 |