报告题目: 利用迁移学习改进与异质性 GWAS 摘要数据相容的遗传效应大小估计
报告人:李启寨(中国科学院大学岗位教授)
报告时间:2024年10月17日 16:30
报告地点:文波楼智慧教室111
摘要: 在全基因组关联研究(GWAS)中,摘要统计已成为最流行的数据共享和分析格式之一。本文的重点是利用全基因组关联研究摘要统计作为辅助数据,提高多基因风险评分(PRS)模型的估算效率。现有方法在很大程度上依赖于完全同质性假设,即所有研究都处于相同的参数模型下,但考虑到不同 GWAS 研究的人群多种多样,这种假设并不现实。生物学证据表明,风险变异在不同人群中可能具有不同的效应大小。为了解决这一局限性,我们引入了 SS-trans,这是一个新颖的框架,它能有效地利用外部研究的异质性汇总数据来加强内部相关研究的统计分析。与现有方法不同的是,我们的框架放宽了完全同质性的要求,只要求不同研究之间的部分参数具有相似性。我们的理论分析表明,即使外部研究仅表现出局部相似性,内部研究的估计准确性也会显著提高。在基因环境关联研究2型糖尿病数据集的合成数据和真实数据上进行的大量数值实验也证明了所提框架的优势。
报告人简介: 李启寨教授,中国科学院数学与系统科学研究院研究员,中国科学院大学岗位教授,美国统计学会会士,国际统计学会推选会员,国家优秀青年科学基金获得者,发表SCI论文100余篇,现任中国数学会常务理事、中国现场统计研究会常务理事等。