Skip to contents

该函数用于根据给定的显著性P值和连锁不平衡(LD)系数,采用本地或在线方式去除GWAS数据中的连锁不平衡(LD)。支持根据"PVAL"或"LOG10P"值进行去除。若数据中存在多个p值接近计算机最小精度(1e-324),建议选择"LOG10P"方法。

Usage

clump_data_local_Online(
  dat,
  snp_col = "SNP",
  pval_col = "pval.exposure",
  clump_method = "PVAL",
  beta_col = "beta.exposure",
  se_col = "se.exposure",
  clump_pval = 5e-08,
  clump_kb = 10000,
  clump_r2 = 0.001,
  pop = "EUR",
  bfile_1000G = NULL
)

Arguments

dat

输入的GWAS数据,必须为数据框(data frame)。

snp_col

字符串,指定SNP列的名称。

pval_col

字符串,指定P值列的名称。

clump_method

字符串,指定去除连锁不平衡的方式,支持"PVAL"和"LOG10P"。

beta_col

字符串,指定beta值列的名称,在选择"LOG10P"方法时需要填写此项。

se_col

字符串,指定se值列的名称,在选择"LOG10P"方法时需要填写此项。

clump_pval

数值,指定显著性P值的过滤阈值,默认为5e-8。

clump_kb

数值,指定连锁不平衡的窗口大小范围,默认为10000。

clump_r2

数值,指定连锁不平衡系数r2的大小,默认为0.001。

pop

字符串,指定人群种族,默认为"EUR"。当选择在线方式去除连锁不平衡时需要填写。

bfile_1000G

字符串,指定千人基因组参考面板数据文件的前缀路径(如:./1.data/1000G/EUR)。若为NULL,则采用在线方式去除连锁不平衡。

Value

返回去除连锁不平衡后的GWAS数据。

Details

该函数通过调用Plink软件(本地方式)或OpenGWAS API(在线方式)来去除数据中的连锁不平衡。用户可以根据需要选择不同的去除方法,并设置相关参数以控制去除过程的精度和范围。