使用HDL包进行局部遗传相关性分析
HDL_L.Rd
应用HDL方法计算两种性状之间的局部遗传相关性。
Usage
HDL_L(
GWASfile = c("./2.pre_data/Frailty_MTAG.txt", "./2.pre_data/Insomnia_MTAG.txt"),
Trait1name = "Trait1",
Trait2name = "Trait2",
LD.path = "G:/QTLMR_test/HDL/LD.path",
bim.path = "G:/QTLMR_test/HDL/bimfile",
Nref = 335272,
N0 = NULL,
start_loc = NULL,
end_loc = NULL,
eigen.cut = 0.99,
intercept.output = FALSE,
fill.missing.N = NULL,
lim = exp(-18),
alpha = 0.05,
save_name = "rg",
save_path = "./HDL",
cores = 5
)
Arguments
- GWASfile
字符型向量,包含两种性状GWAS汇总统计数据的MTAG格式文件路径。例如
c("./2.pre_data/Frailty_MTAG.txt", "./2.pre_data/Insomnia_MTAG.txt")
。- Trait1name
字符型,性状1的名称。
- Trait2name
字符型,性状2的名称。
- LD.path
字符型,存放连锁不平衡(LD)信息的目录路径。LD数据用于计算LD矩阵。
- bim.path
字符型,存放解压后的
bimfile.zip
文件的目录路径,用于LD计算。- Nref
整数,参考样本的样本大小,用于计算LD矩阵。UKB生物库数据默认值为335272,若使用UKB-ppp cis-pQTL,样本量为54219。
- N0
整数,用于遗传相关性估计的样本数量。若为NULL,默认使用两个GWAS数据集中的最小样本量。
- start_loc
整数或NULL,遗传相关性分析的起始位置(染色体区域),默认为NULL时,则对所有区域进行分析。
- end_loc
整数或NULL,遗传相关性分析的结束位置(染色体区域),默认为NULL时,则对所有区域进行分析。
- eigen.cut
数值,用于HDL方法计算时的特征值阈值。默认值为0.99。
- intercept.output
布尔值,是否输出截距项。默认为FALSE。
- fill.missing.N
字符型或NULL,如何处理SNP的缺失样本量(N)。默认为NULL,表示删除缺失N的SNP。可以选择 "median"、"min" 或 "max" 进行填充。
- lim
数值,公差限制,用于控制计算精度。默认为
exp(-18)
。- alpha
数值,计算似然置信区间时的显著性水平。默认为0.05。
- save_name
字符型,结果输出文件的前缀名称。
- save_path
字符型,输出结果的保存路径。
- cores
整数,并行运行的线程数量。