新闻资讯

Nature Medicine重磅 | 首张大规模暴露组-表型组全景关联图谱问世，系统勾勒环境暴露与全身健康、各类疾病风险的对应关系！

2026-05-07

中科新生命

在基因组时代，人们越来越关注遗传因素对健康的影响，但环境暴露（exposome）——包括我们日常接触的饮食、生活方式、污染物、感染、行为习惯等非遗传因素——同样深刻塑造着我们的表型和疾病风险。传统研究往往局限于少数候选暴露与特定表型，容易产生碎片化结果和假阳性，难以全面揭示环境因素的系统作用。

2026年3月18日，哈佛医学院Chirag J. Patel团队联合斯坦福大学John P. A. Ioannidis和Arjun K. Manrai教授，在Nature Medicine发表题为“An atlas of exposome–phenome associations in health and disease risk”的重磅论文。该研究利用美国NHANES十个波次（1999-2018）的大规模人群数据，系统构建了迄今最全面的暴露组-表型组关联图谱，为精准医学中整合环境因素提供了坚实的数据基础。

技术方法

研究采用暴露组-表型组全景关联研究（P-ExWAS）策略，对619种暴露指标和305种定量临床表型进行系统关联分析。

研究亮点

构建了覆盖619种暴露与305种表型的全面关联图谱，填补了暴露组全景研究的空白。

心血管代谢和人体测量表型中信号最集中，多暴露聚合效应可媲美遗传多基因评分。

揭示暴露间致密互联网络，凸显累积暴露和客观生物标志物的重要性。

为疾病风险评估、暴露优先级排序和精准干预提供了实用工具。

研究结果

1.研究设计与全景关联分析

研究团队整合了1999-2018年NHANES 10 次连续横断面调查的数据，构建了庞大的暴露组-表型组关联数据库（图1）。他们对619种暴露指标（涵盖饮食生物标志物、污染物、吸烟行为、感染、生活方式等多个领域）和305种定量临床表型进行了系统P-ExWAS分析。运用调查加权回归，在9种不同调整模型下考察关联强度，包括：

（1）主要报告模型，包括年龄、年龄²、性别、收入、种族、教育程度以及调查年份；

（2）基本模型，不进行任何调整；

（3）性别和调查年份；

（4）年龄、年龄²和调查年份；

（5）性别、年龄、年龄²和调查年份；

（6）种族和调查年份；

（7）收入、教育和调查年份；

（8）年龄、年龄²、性别、种族和调查年份；

（9）年龄、年龄²、性别、收入、教育和调查年份。

并通过Bonferroni校正（α=4×10⁻⁷）和FDR 5%严格控制多重检验。同时系统评估了跨队列复制率、单个及多暴露聚合模型的方差解释（R²）、暴露间相关性网络（Exposome Globes），以及年龄-暴露交互作用等（图1）。

图1 系统性暴露组-表型组全景关联研究（P-ExWAS）构建流程图（左）及暴露组结构估计的方法（右）

经过严格统计校正，Bonferroni显著的关联共5,674个，占全部测试的约5%；FDR 5%水平下则达到15,386个关联（图2a）。不同表型类别中，人体测量学表型（如BMI、腰围）显著关联比例最高（13%）；暴露类别中，吸烟相关标志物（15%）和饮食/营养生物标志物（13%）贡献了最多的稳健信号（图2b、c）。这一全景图谱清晰显示，暴露对表型的影响呈现出明显的类别特异性。

图2 暴露组对表型组的关联架构

2. 暴露对表型变异的解释力

研究重点量化了暴露因素对表型变异的贡献（图3）。单个暴露解释的表型方差中位数仅为0.14%，Bonferroni显著关联的中位R²约为0.6%（ IQR ：0.3%-1%）。不同类别中，炎症相关表型的暴露解释力平均较高，有机氯污染物等暴露类别可平均解释约3%的变异，饮食生物标志物平均解释1%的变异，而依赖自我报告的饮食变量解释力相对较低（图3a-c）。

图3 暴露物对表型群体变异解释分析

当构建“多暴露组”聚合模型（同时纳入20种FDR显著暴露，并对缺失数据进行填补）时，解释力大幅提升。在119个表型中，中位R²达到3.5%（IQR 1.8%-7.9%），最高纪录由甘油三酯，一种用于筛查心血管疾病的重要临床表型所创造（图3d）——多暴露模型解释了高达43%的变异（校正总胆固醇后依然稳健）。主要贡献因素包括反式脂肪酸、α-生育酚、γ-生育酚等亲脂性暴露以及持久性污染物。这一发现强调，累积的环境暴露对心血管风险关键标志物的影响远超单个因素。

3. 暴露组-表型组关联图谱（Phenome-Exposome Atlas）

研究绘制了完整的关联热图（图4a），直观呈现305种表型与625种暴露之间的关系。暴露因素之间形成高度互联的复杂网络（图4b-c）。研究用“Exposome Globes”可视化这一架构：污染物、感染和营养因子节点间存在大量相关性。

图4 暴露组-表型组关联图谱

暴露因素间的相关性中位数为0.01，但对于通过 Bonferroni 校正阈值（P< 0.05/201,265）的暴露-暴露相关性，中位绝对值达0.21，最高可达0.69。与BMI或糖化血红蛋白相关的暴露之间，相关性明显强于随机暴露（图4d，蓝色曲线）。

4. 不同暴露类别之间关联的一致性

在流行病学研究中，膳食营养素暴露评估主要依赖自我报告问卷。研究发现，共有1452种表型与自我报告的营养素变量存在Bonferroni校正后的显著关联，但这些关联的解释力较弱，中位R²仅为0.2%。

研究团队推测，这种较弱的相关性可能与测量噪声有关。他们进一步比较了受试者连续两天自我报告的膳食摄入数据，结果显示，第一天与第二天的69项营养素回顾数据中位相关系数仅为0.36（IQR 0.28–0.43）。而两天自我报告所得的表型-暴露关联强度相关性则较高，达到0.84（图5a）。

相比之下，客观的膳食生物标志物的表现显著更好。在1101个具有Bonferroni显著性的表型中，其R²中位数达到1%，是自我报告对应值的五倍。生物标志物与自我报告值之间的Pearson相关系数为0.52，而在显著关联中，这一相关系数提升至0.60（图5b）。

图5 不同领域表型-暴露关联的一致性

此外，血液和尿液污染物生物标志物之间也显示出较强的生物学一致性，Pearson相关系数达0.72。对于Bonferroni显著的血液生物标志物，血液与尿液标志物对同一表型的关联强度相关系数更高：镉为0.78，可替宁为0.96，汞为0.71（图5c）。这些结果凸显了精准客观测量在未来临床应用中的价值。

5. 特定临床表型的深入解析

a. 吸烟与肺功能：吸烟是导致肺功能下降的重要危险因素，尤其是对一秒用力呼气容积（FEV1）的影响。研究证实，吸烟相关生物标志物——尿液NNAL和血清可替宁均与FEV1呈负相关，与现有证据一致。其中，尿液NNAL（烟草特异性亚硝胺）的关联强度显著更高：每增加一个标准差，FEV1下降0.06（R²=0.2%）；而血清可替宁的效应较弱（每增加一个标准差，FEV1下降0.03，R²=0.08%）。这种差异源于两者的生物学特性：可替宁是尼古丁的短半衰期代谢物，主要反映近期暴露，且日间波动较大；而NNAL半衰期长达10-16天，能更稳定地反映累积烟草暴露。此外，研究还发现了许多其他暴露因素与FEV1密切相关（图6a）。

图6 特定临床表型与暴露组间的关联分析

b. 甲基化与认知：通过对多种与衰老相关的生物标志物，包括表观遗传年龄（如Horvath生物年龄预测模型和包含吸烟状况的GrimAge）及临床上用于评估老年人认知衰退的数字符号替换测试，研究人员发现，挥发性有机化合物（VOCs）、吸烟指标（可替宁）和体力活动与认知功能关联最强（图6b-c）。进一步分析发现，较好的认知功能与其他表型存在“共同暴露结构”，例如与较高的呼出气一氧化二氮（相关性0.35）和尿肌酐水平显著相关（图6d）。在加速表观遗传年龄（GrimAgeMort）方面，最强的关联信号来自吸烟、重金属和体力活动。其中，体力活动单独解释的方差最大（R²<1%）；但从整体暴露组来看，10种暴露因素共同解释了GrimAgeMort约10%的方差。

c. 年龄与暴露组相互作用：此外，约15%的Bonferroni显著关联在单变量模型与全调整模型间出现方向翻转，提示人口统计学因素（如年龄、性别、收入、教育、种族）的混杂影响不容忽视。年龄-暴露交互分析显示，多数表型中交互项对总体R²提升有限，但仍为个性化风险评估提供了重要参考（图6e-g）。

6. 与全基因组关联研究的比较

研究团队进一步利用英国生物银行的数据，对遗传因素和暴露组因素的预测能力进行了直接比较。他们分析了29种表型，使用基于约100万个基因型的全基因组关联研究（GWAS）计算遗传因素解释的方差。结果显示：a. 遗传因素的R²增量中位数为7.9%（IQR 2.8%–9.3%，最大21%）；b. 暴露组因素（20个暴露变量）在39种表型中的R²增量中位数同样为7.9%（IQR 3.1%–12%，最大57%）。

当同时纳入多个暴露因素建模时，暴露组整体解释的方差与全基因组遗传因素相当（图7）。其中，55%（16/29）的表型中，暴露组解释的方差超过了遗传因素。例如，在BMI这一关键表型上，遗传变异（基于100万个常见SNP）和20个暴露因素共同解释的方差均约为10%，二者预测能力接近。这有力说明：环境不是遗传的“配角”，而是能与之并驾齐驱的关键力量。

图7 29种定量生理表型的暴露组R²与基因组R²比较

小结

这项《Nature Medicine》研究首次系统绘制了暴露组-表型组关联图谱，深刻揭示了环境因素如何通过累积、互联和聚合的方式“编程”我们的健康与疾病风险。它超越传统单一因素研究，强调客观测量、多暴露视角和网络思维的重要性，为精准医学、风险预测模型优化以及暴露干预优先级排序提供了宝贵数据支撑。

在日常生活中，我们的每一次饮食选择、每一次环境接触，都在悄然刻写着身体的表型轨迹。理解这张科学图谱，能帮助我们从被动应对转向主动优化，做出更理性的健康决策。

中科优品推荐

【中科新生命】针对暴露组学研究，隆重推出暴露组检测的一系列产品（涵盖E300高通量靶向暴露组、金属元素、微塑料、全氟化合物）。还另外提供高端定制方案，除全面的暴露组检测产品外，配套微生物组、代谢组等多组学检测服务与完善的生信分析服务，针对暴露组对人群队列健康影响提供一站式研究解决方案，为您的研究精准定位，保驾护航。欢迎感兴趣的老师前来咨询！

滑动图片查看更多>>>

关于中科新生命

上海中科新生命生物科技有限公司（APTBIO）创立于 2004 年，由原中国科学院上海生命科学研究院蛋白质组研究中心孵化而来，是国内质谱多组学应用领域的开拓者。公司以 “AI + 质谱多组学” 双核驱动创新，构建智能化组学生态。拥有自主知识产权的质谱检测平台与 AI 大数据分析系统，聚焦科技服务、生物医药及大健康消费三大领域，为全球科研机构、医院、药企提供从基础研究到临床转化的一站式解决方案。融合多组学技术与人工智能，围绕生物标志物发掘、药物靶点筛选及个性化诊疗等方向，构建具有国际竞争力的组学数据库与算法模型，推动转化医学进程，加速创新药物研发，成为推动生命科学数字化升级的核心引领者。

上一篇：没有了

下一篇： 1+1＞2！一文看单细胞+深度空间代谢组如何打通基因调控到代谢产物的“任督二脉”！

其它新闻 + MORE

项目文章Cell Rep |中国医科院刘芝华教授团队利用三组学联合分析揭示OTUB2/STAT1/CALML3/PS轴的抑癌机制 2022-11-09

文末福利 | 喜讯！中科新生命10月发表项目文章40篇，平均影响因子7.43分！ 2022-11-09

O-糖基化修饰项目文章二连发（IF＞10）浙江大学喻景权院士团队同期发表两篇O-GlcNAc相关高分文章 2022-11-11