本地或在线方式去除连锁不平衡
clump_data_local_Online.Rd
该函数用于根据给定的显著性P值和连锁不平衡(LD)系数,采用本地或在线方式去除GWAS数据中的连锁不平衡(LD)。支持根据"PVAL"或"LOG10P"值进行去除。若数据中存在多个p值接近计算机最小精度(1e-324),建议选择"LOG10P"方法。
Usage
clump_data_local_Online(
dat,
snp_col = "SNP",
pval_col = "pval.exposure",
clump_method = "PVAL",
beta_col = "beta.exposure",
se_col = "se.exposure",
clump_pval = 5e-08,
clump_kb = 10000,
clump_r2 = 0.001,
pop = "EUR",
bfile_1000G = NULL
)
Arguments
- dat
输入的GWAS数据,必须为数据框(data frame)。
- snp_col
字符串,指定SNP列的名称。
- pval_col
字符串,指定P值列的名称。
- clump_method
字符串,指定去除连锁不平衡的方式,支持"PVAL"和"LOG10P"。
- beta_col
字符串,指定beta值列的名称,在选择"LOG10P"方法时需要填写此项。
- se_col
字符串,指定se值列的名称,在选择"LOG10P"方法时需要填写此项。
- clump_pval
数值,指定显著性P值的过滤阈值,默认为5e-8。
- clump_kb
数值,指定连锁不平衡的窗口大小范围,默认为10000。
- clump_r2
数值,指定连锁不平衡系数r2的大小,默认为0.001。
- pop
字符串,指定人群种族,默认为"EUR"。当选择在线方式去除连锁不平衡时需要填写。
- bfile_1000G
字符串,指定千人基因组参考面板数据文件的前缀路径(如:
./1.data/1000G/EUR
)。若为NULL,则采用在线方式去除连锁不平衡。