Skip to contents

该函数用于通过给定的GWAS数据和连锁窗口大小(kb)及连锁系数(r2),获取与指定SNP存在连锁不平衡的其他SNP。可以使用千人基因组(1000G)参考面板数据文件来进行连锁不平衡计算。

Usage

clump_LD_R2(
  dat,
  snp_col = "SNP",
  clump_kb = 1000,
  clump_r2 = 0.01,
  bfile_1000G = "G:/QTLMR_test/1kg.v3/EUR"
)

Arguments

dat

输入的GWAS数据,必须为数据框(data frame)。

snp_col

字符串,指定SNP列的名称。

clump_kb

数值,指定连锁窗口大小范围,默认为1000。

clump_r2

数值,指定连锁系数r2的大小,默认为0.2。该参数控制连锁不平衡的筛选标准。

bfile_1000G

字符串,指定千人基因组参考面板数据文件的路径。避免使用MAF > 0.01版本。完整版下载地址:http://fileserve.mrcieu.ac.uk/ld/1kg.v3.tgz。

Value

返回与输入数据中SNP具有连锁不平衡的SNP列表。

Details

该函数通过调用Plink软件,使用千人基因组数据计算连锁不平衡(LD)并筛选出与输入SNP存在显著LD的其他SNP。用户可以根据需要调整窗口大小(clump_kb)和r2阈值(clump_r2)来控制连锁不平衡的筛选标准。