Skip to contents

该函数是HDL_rg的并行版本,基于GWAS汇总统计数据返回两个性状之间的遗传相关性估计值及其标准误。

Usage

HDL_rg_parallel(
  GWASfile = c("./XXX_MTAG.txt", "./XXX_MTAG_IEU.txt"),
  LD.path,
  Nref = 335265,
  N0 = NULL,
  numCores = 2,
  eigen.cut = "automatic",
  jackknife.df = FALSE,
  intercept.output = FALSE,
  fill.missing.N = NULL,
  lim = exp(-18),
  verbose = FALSE,
  save_name = "rg",
  save_path = "./HDL"
)

Arguments

GWASfile

包含两个MTAG格式的GWAS数据文件的路径,如c("./XXX_MTAG.txt", "./XXX_MTAG_IEU.txt"),可由format_dat()转换获得。

LD.path

存储连锁不平衡(LD)信息的目录路径。

Nref

用于计算LD的参考样本的样本量。如果使用默认的UK Biobank参考样本,则Nref = 335265。

N0

数值,两个队列中共同包含的个体数。估算的遗传相关性对错误指定的N0通常具有鲁棒性。若为NULL(默认值),默认值设置为队列1和队列2所有SNP中的最小样本量。

numCores

使用的核心数量。

eigen.cut

用于HDL的LD分数矩阵中的特征值和特征向量。用户可指定0到1之间的数值。例如,eigen.cut = 0.99表示使用解释99%方差的主特征值及其对应的特征向量。如果使用默认的“自动”选项,将选择能够提供最稳定遗传力估计的eigen.cut。

jackknife.df

逻辑值,默认为FALSE。是否返回块-删失法的估计结果?

intercept.output

逻辑值,默认为FALSE。是否在estimates.df中包含截距项?

fill.missing.N

若为NULL(默认值),则缺失N的SNP将被移除。可以指定“median”、“min”或“max”来填充缺失的N。例如,“median”表示使用有N值的SNP的中位数填充缺失的N。

lim

公差限制,默认lim = exp(-18)。

verbose

逻辑值,默认为FALSE。是否在控制台打印遗传协方差优化过程。

save_name

保存文件的文件名称。

save_path

文件保存路径。

Value

返回一个包含以下内容的列表:

  • rg 估计的遗传相关性。

  • rg.se 估计的遗传相关性的标准误。

  • P 基于Wald检验的P值。

  • estimates.df 包含遗传力、遗传协方差和遗传相关性的估计值和标准误的详细矩阵。

  • eigen.use 计算中使用的eigen.cut。

Note

用户可以下载欧洲血统人群的预计算LD相关矩阵特征值和特征向量。下载链接:https://github.com/zhenin/HDL/wiki/Reference-panels。以下是从335,265位英国UK Biobank个体中计算得到的LD矩阵及其特征值分解。提供三组参考面板: 1)1,029,876个经过质量控制的UK Biobank的HapMap3基因型填充SNP。解压后大小约为33 GB。尽管耗时较长,但使用填充的面板可提供更准确的遗传相关性估计。因此,如果GWAS包含大部分HapMap3 SNP,建议使用该填充参考面板。 2)769,306个经过质量控制的UK Biobank的HapMap2基因型填充SNP。解压后大小约为18 GB。如果您的GWAS包含大部分HapMap2 SNP,但上述HapMap3参考面板中缺少许多SNP(超过1%),则推荐使用该HapMap2面板。 3)307,519个经过质量控制的UK Biobank Axiom Array SNP。解压后大小约为7.5 GB。

References

Ning Z, Pawitan Y, Shen X. High-definition likelihood inference of genetic correlations across human complex traits. Nat Genet. 2020 Aug;52(8):859-864.

See also

HDL教程:https://github.com/zhenin/HDL

Author

Zheng Ning, Xia Shen