使用HDL包基于SNP的遗传力的高精度似然推断
HDL_h2.Rd
该函数基于GWAS汇总统计数据返回单一性状的SNP遗传力估计值及其标准误。
Usage
HDL_h2(
GWASfile = " ",
LD.path = " ",
Nref = 335265,
eigen.cut = "automatic",
intercept.output = FALSE,
fill.missing.N = NULL,
lim = exp(-18),
save_name = "h2",
save_path = "./HDL"
)
Arguments
- GWASfile
字符型,MTAG格式数据文件路径,可由
format_dat()
函数转换获得。- LD.path
存储连锁不平衡(LD)信息的目录路径。
- Nref
用于计算LD的参考样本的样本量。如果使用默认的UK Biobank参考样本,则Nref = 335265。
- eigen.cut
用于HDL的LD分数矩阵中的特征值和特征向量。用户可指定0到1之间的数值。例如,eigen.cut = 0.99表示使用解释99%方差的主特征值及其对应的特征向量。如果使用默认的“自动”选项,将选择能够提供最稳定遗传力估计的eigen.cut。
- intercept.output
逻辑值,默认为FALSE。是否在estimates.df中包含截距项?
- fill.missing.N
如果为NULL(默认值),则缺失N的SNP将被移除。可以指定“median”、“min”或“max”以填充缺失的N。例如,“median”表示使用有N值的SNP的中位数来填充缺失的N。
- lim
公差限制,默认lim = exp(-18)。
- save_name
保存文件的文件名称。
- save_path
文件保存路径。
Note
用户可以下载欧洲血统人群的预计算LD相关矩阵特征值和特征向量。下载链接:https://github.com/zhenin/HDL/wiki/Reference-panels。以下是从335,265位英国UK Biobank个体中计算得到的LD矩阵及其特征值分解。提供三组参考面板: 1)1,029,876个经过质量控制的UK Biobank的HapMap3基因型填充SNP。解压后大小约为33 GB。尽管耗时较长,但使用填充的面板可提供更准确的遗传相关性估计。因此,如果GWAS包含大部分HapMap3 SNP,建议使用该填充参考面板。 2)769,306个经过质量控制的UK Biobank的HapMap2基因型填充SNP。解压后大小约为18 GB。如果您的GWAS包含大部分HapMap 2 SNP,但上述HapMap 3参考面板中缺少许多SNP(超过1%),则推荐使用该HapMap2面板进行HDL分析。 3)307,519个经过质量控制的UK Biobank Axiom Array SNP。解压后大小约为7.5 GB。