Skip to contents

该函数基于GWAS汇总统计数据返回单一性状的SNP遗传力估计值及其标准误。

Usage

HDL_h2(
  GWASfile = " ",
  LD.path = " ",
  Nref = 335265,
  eigen.cut = "automatic",
  intercept.output = FALSE,
  fill.missing.N = NULL,
  lim = exp(-18),
  save_name = "h2",
  save_path = "./HDL"
)

Arguments

GWASfile

字符型,MTAG格式数据文件路径,可由format_dat()函数转换获得。

LD.path

存储连锁不平衡(LD)信息的目录路径。

Nref

用于计算LD的参考样本的样本量。如果使用默认的UK Biobank参考样本,则Nref = 335265。

eigen.cut

用于HDL的LD分数矩阵中的特征值和特征向量。用户可指定0到1之间的数值。例如,eigen.cut = 0.99表示使用解释99%方差的主特征值及其对应的特征向量。如果使用默认的“自动”选项,将选择能够提供最稳定遗传力估计的eigen.cut。

intercept.output

逻辑值,默认为FALSE。是否在estimates.df中包含截距项?

fill.missing.N

如果为NULL(默认值),则缺失N的SNP将被移除。可以指定“median”、“min”或“max”以填充缺失的N。例如,“median”表示使用有N值的SNP的中位数来填充缺失的N。

lim

公差限制,默认lim = exp(-18)。

save_name

保存文件的文件名称。

save_path

文件保存路径。

Value

返回一个包含以下内容的列表:

  • h2 估计的基于SNP的遗传力。

  • h2.se 估计的遗传力的标准误。

  • P 基于Wald检验的P值。

  • eigen.use 计算中使用的eigen.cut。

Note

用户可以下载欧洲血统人群的预计算LD相关矩阵特征值和特征向量。下载链接:https://github.com/zhenin/HDL/wiki/Reference-panels。以下是从335,265位英国UK Biobank个体中计算得到的LD矩阵及其特征值分解。提供三组参考面板: 1)1,029,876个经过质量控制的UK Biobank的HapMap3基因型填充SNP。解压后大小约为33 GB。尽管耗时较长,但使用填充的面板可提供更准确的遗传相关性估计。因此,如果GWAS包含大部分HapMap3 SNP,建议使用该填充参考面板。 2)769,306个经过质量控制的UK Biobank的HapMap2基因型填充SNP。解压后大小约为18 GB。如果您的GWAS包含大部分HapMap 2 SNP,但上述HapMap 3参考面板中缺少许多SNP(超过1%),则推荐使用该HapMap2面板进行HDL分析。 3)307,519个经过质量控制的UK Biobank Axiom Array SNP。解压后大小约为7.5 GB。

References

Ning Z, Pawitan Y, Shen X. High-definition likelihood inference of genetic correlations across human complex traits. Nat Genet. 2020 Aug;52(8):859-864.

See also

HDL教程:https://github.com/zhenin/HDL

Author

Zheng Ning, Xia Shen