新闻资讯

Nature Medicine重磅 | 首张大规模暴露组-表型组全景关联图谱问世,系统勾勒环境暴露与全身健康、各类疾病风险的对应关系!

2026-05-07
中科新生命
11

在基因组时代,人们越来越关注遗传因素对健康的影响,但环境暴露(exposome)——包括我们日常接触的饮食、生活方式、污染物、感染、行为习惯等非遗传因素——同样深刻塑造着我们的表型和疾病风险。传统研究往往局限于少数候选暴露与特定表型,容易产生碎片化结果和假阳性,难以全面揭示环境因素的系统作用。

2026年3月18日,哈佛医学院Chirag J. Patel团队联合斯坦福大学John P. A. Ioannidis和Arjun K. Manrai教授,在Nature Medicine发表题为“An atlas of exposome–phenome associations in health and disease risk”的重磅论文。该研究利用美国NHANES十个波次(1999-2018)的大规模人群数据,系统构建了迄今最全面的暴露组-表型组关联图谱,为精准医学中整合环境因素提供了坚实的数据基础。

 

 

 技术方法

研究采用暴露组-表型组全景关联研究(P-ExWAS)策略,对619种暴露指标和305种定量临床表型进行系统关联分析。

 

 

 研究亮点

构建了覆盖619种暴露与305种表型的全面关联图谱,填补了暴露组全景研究的空白。

心血管代谢和人体测量表型中信号最集中,多暴露聚合效应可媲美遗传多基因评分。

揭示暴露间致密互联网络,凸显累积暴露和客观生物标志物的重要性。

为疾病风险评估、暴露优先级排序和精准干预提供了实用工具。

 

 

 研究结果

1.研究设计与全景关联分析

研究团队整合了1999-2018年NHANES 10 次连续横断面调查的数据,构建了庞大的暴露组-表型组关联数据库(图1)。他们对619种暴露指标(涵盖饮食生物标志物、污染物、吸烟行为、感染、生活方式等多个领域)和305种定量临床表型进行了系统P-ExWAS分析。运用调查加权回归,在9种不同调整模型下考察关联强度,包括:

(1)主要报告模型,包括年龄、年龄²、性别、收入、种族、教育程度以及调查年份;

(2)基本模型,不进行任何调整;

(3)性别和调查年份;

(4)年龄、年龄²和调查年份;

(5)性别、年龄、年龄²和调查年份;

(6)种族和调查年份;

(7)收入、教育和调查年份;

(8)年龄、年龄²、性别、种族和调查年份;

(9)年龄、年龄²、性别、收入、教育和调查年份。

并通过Bonferroni校正(α=4×10⁻⁷)和FDR 5%严格控制多重检验。同时系统评估了跨队列复制率、单个及多暴露聚合模型的方差解释(R²)、暴露间相关性网络(Exposome Globes),以及年龄-暴露交互作用等(图1)。

图1 系统性暴露组-表型组全景关联研究(P-ExWAS)构建流程图(左)及暴露组结构估计的方法(右)

经过严格统计校正,Bonferroni显著的关联共5,674个,占全部测试的约5%;FDR 5%水平下则达到15,386个关联(图2a)。不同表型类别中,人体测量学表型(如BMI、腰围)显著关联比例最高(13%);暴露类别中,吸烟相关标志物(15%)和饮食/营养生物标志物(13%)贡献了最多的稳健信号(图2b、c)。这一全景图谱清晰显示,暴露对表型的影响呈现出明显的类别特异性。

图2 暴露组对表型组的关联架构

 

2. 暴露对表型变异的解释力

研究重点量化了暴露因素对表型变异的贡献(图3)。单个暴露解释的表型方差中位数仅为0.14%,Bonferroni显著关联的中位R²约为0.6%( IQR :0.3%-1%)。不同类别中,炎症相关表型的暴露解释力平均较高,有机氯污染物等暴露类别可平均解释约3%的变异,饮食生物标志物平均解释1%的变异,而依赖自我报告的饮食变量解释力相对较低(图3a-c)。

图3 暴露物对表型群体变异解释分析

当构建“多暴露组”聚合模型(同时纳入20种FDR显著暴露,并对缺失数据进行填补)时,解释力大幅提升。在119个表型中,中位R²达到3.5%(IQR 1.8%-7.9%),最高纪录由甘油三酯,一种用于筛查心血管疾病的重要临床表型所创造(图3d)——多暴露模型解释了高达43%的变异(校正总胆固醇后依然稳健)。主要贡献因素包括反式脂肪酸、α-生育酚、γ-生育酚等亲脂性暴露以及持久性污染物。这一发现强调,累积的环境暴露对心血管风险关键标志物的影响远超单个因素。

 

3. 暴露组-表型组关联图谱(Phenome-Exposome Atlas)

研究绘制了完整的关联热图(图4a),直观呈现305种表型与625种暴露之间的关系。暴露因素之间形成高度互联的复杂网络(图4b-c)。研究用“Exposome Globes”可视化这一架构:污染物、感染和营养因子节点间存在大量相关性。

图4 暴露组-表型组关联图谱

暴露因素间的相关性中位数为0.01,但对于通过 Bonferroni 校正阈值(P< 0.05/201,265)的暴露-暴露相关性,中位绝对值达0.21,最高可达0.69。与BMI或糖化血红蛋白相关的暴露之间,相关性明显强于随机暴露(图4d,蓝色曲线)。

 

4. 不同暴露类别之间关联的一致性

在流行病学研究中,膳食营养素暴露评估主要依赖自我报告问卷。研究发现,共有1452种表型与自我报告的营养素变量存在Bonferroni校正后的显著关联,但这些关联的解释力较弱,中位R²仅为0.2%。

研究团队推测,这种较弱的相关性可能与测量噪声有关。他们进一步比较了受试者连续两天自我报告的膳食摄入数据,结果显示,第一天与第二天的69项营养素回顾数据中位相关系数仅为0.36(IQR 0.28–0.43)。而两天自我报告所得的表型-暴露关联强度相关性则较高,达到0.84(图5a)。

相比之下,客观的膳食生物标志物的表现显著更好。在1101个具有Bonferroni显著性的表型中,其R²中位数达到1%,是自我报告对应值的五倍。生物标志物与自我报告值之间的Pearson相关系数为0.52,而在显著关联中,这一相关系数提升至0.60(图5b)。

图5 不同领域表型-暴露关联的一致性

此外,血液和尿液污染物生物标志物之间也显示出较强的生物学一致性,Pearson相关系数达0.72。对于Bonferroni显著的血液生物标志物,血液与尿液标志物对同一表型的关联强度相关系数更高:镉为0.78,可替宁为0.96,汞为0.71(图5c)。这些结果凸显了精准客观测量在未来临床应用中的价值。

 

5. 特定临床表型的深入解析

a. 吸烟与肺功能:吸烟是导致肺功能下降的重要危险因素,尤其是对一秒用力呼气容积(FEV1)的影响。研究证实,吸烟相关生物标志物——尿液NNAL和血清可替宁均与FEV1呈负相关,与现有证据一致。其中,尿液NNAL(烟草特异性亚硝胺)的关联强度显著更高:每增加一个标准差,FEV1下降0.06(R²=0.2%);而血清可替宁的效应较弱(每增加一个标准差,FEV1下降0.03,R²=0.08%)。这种差异源于两者的生物学特性:可替宁是尼古丁的短半衰期代谢物,主要反映近期暴露,且日间波动较大;而NNAL半衰期长达10-16天,能更稳定地反映累积烟草暴露。此外,研究还发现了许多其他暴露因素与FEV1密切相关(图6a)。

图6 特定临床表型与暴露组间的关联分析

b. 甲基化与认知:通过对多种与衰老相关的生物标志物,包括表观遗传年龄(如Horvath生物年龄预测模型和包含吸烟状况的GrimAge)及临床上用于评估老年人认知衰退的数字符号替换测试,研究人员发现,挥发性有机化合物(VOCs)、吸烟指标(可替宁)和体力活动与认知功能关联最强(图6b-c)。进一步分析发现,较好的认知功能与其他表型存在“共同暴露结构”,例如与较高的呼出气一氧化二氮(相关性0.35)和尿肌酐水平显著相关(图6d)。在加速表观遗传年龄(GrimAgeMort)方面,最强的关联信号来自吸烟、重金属和体力活动。其中,体力活动单独解释的方差最大(R²<1%);但从整体暴露组来看,10种暴露因素共同解释了GrimAgeMort约10%的方差。

c. 年龄与暴露组相互作用:此外,约15%的Bonferroni显著关联在单变量模型与全调整模型间出现方向翻转,提示人口统计学因素(如年龄、性别、收入、教育、种族)的混杂影响不容忽视。年龄-暴露交互分析显示,多数表型中交互项对总体R²提升有限,但仍为个性化风险评估提供了重要参考(图6e-g)。

 

6. 与全基因组关联研究的比较

研究团队进一步利用英国生物银行的数据,对遗传因素和暴露组因素的预测能力进行了直接比较。他们分析了29种表型,使用基于约100万个基因型的全基因组关联研究(GWAS)计算遗传因素解释的方差。结果显示:a. 遗传因素的R²增量中位数为7.9%(IQR 2.8%–9.3%,最大21%);b. 暴露组因素(20个暴露变量)在39种表型中的R²增量中位数同样为7.9%(IQR 3.1%–12%,最大57%)。

当同时纳入多个暴露因素建模时,暴露组整体解释的方差与全基因组遗传因素相当(图7)。其中,55%(16/29)的表型中,暴露组解释的方差超过了遗传因素。例如,在BMI这一关键表型上,遗传变异(基于100万个常见SNP)和20个暴露因素共同解释的方差均约为10%,二者预测能力接近。这有力说明:环境不是遗传的“配角”,而是能与之并驾齐驱的关键力量。

图7 29种定量生理表型的暴露组R2与基因组R2比较

 

 

 小结

这项《Nature Medicine》研究首次系统绘制了暴露组-表型组关联图谱,深刻揭示了环境因素如何通过累积、互联和聚合的方式“编程”我们的健康与疾病风险。它超越传统单一因素研究,强调客观测量、多暴露视角和网络思维的重要性,为精准医学、风险预测模型优化以及暴露干预优先级排序提供了宝贵数据支撑。

在日常生活中,我们的每一次饮食选择、每一次环境接触,都在悄然刻写着身体的表型轨迹。理解这张科学图谱,能帮助我们从被动应对转向主动优化,做出更理性的健康决策。

 

 

中科优品推荐

【中科新生命】针对暴露组学研究,隆重推出暴露组检测的一系列产品(涵盖E300高通量靶向暴露组、金属元素、微塑料、全氟化合物)。还另外提供高端定制方案,除全面的暴露组检测产品外,配套微生物组、代谢组等多组学检测服务与完善的生信分析服务,针对暴露组对人群队列健康影响提供一站式研究解决方案,为您的研究精准定位,保驾护航。欢迎感兴趣的老师前来咨询!

滑动图片查看更多>>>

 

 

 

 

关于中科新生命

 

 

上海中科新生命生物科技有限公司(APTBIO)创立于 2004 年,由原中国科学院上海生命科学研究院蛋白质组研究中心孵化而来,是国内质谱多组学应用领域的开拓者。公司以 “AI + 质谱多组学” 双核驱动创新,构建智能化组学生态。拥有自主知识产权的质谱检测平台与 AI 大数据分析系统,聚焦科技服务、生物医药及大健康消费三大领域,为全球科研机构、医院、药企提供从基础研究到临床转化的一站式解决方案。融合多组学技术与人工智能,围绕生物标志物发掘、药物靶点筛选及个性化诊疗等方向,构建具有国际竞争力的组学数据库与算法模型,推动转化医学进程,加速创新药物研发,成为推动生命科学数字化升级的核心引领者。