获取连锁的SNP — clump_LD_R2 • QTLMR

该函数用于通过给定的GWAS数据和连锁窗口大小（kb）及连锁系数（r2），获取与指定SNP存在连锁不平衡的其他SNP。可以使用千人基因组（1000G）参考面板数据文件来进行连锁不平衡计算。

Usage

clump_LD_R2(
  dat,
  snp_col = "SNP",
  clump_kb = 1000,
  clump_r2 = 0.01,
  bfile_1000G = "G:/QTLMR_test/1kg.v3/EUR"
)

Arguments

dat: 输入的GWAS数据，必须为数据框（data frame）。
snp_col: 字符串，指定SNP列的名称。
clump_kb: 数值，指定连锁窗口大小范围，默认为1000。
clump_r2: 数值，指定连锁系数r2的大小，默认为0.2。该参数控制连锁不平衡的筛选标准。
bfile_1000G: 字符串，指定千人基因组参考面板数据文件的路径。避免使用MAF > 0.01版本。完整版下载地址：http://fileserve.mrcieu.ac.uk/ld/1kg.v3.tgz。

Value

返回与输入数据中SNP具有连锁不平衡的SNP列表。

Details

该函数通过调用Plink软件，使用千人基因组数据计算连锁不平衡（LD）并筛选出与输入SNP存在显著LD的其他SNP。用户可以根据需要调整窗口大小（clump_kb）和r2阈值（clump_r2）来控制连锁不平衡的筛选标准。