该函数用于通过给定的GWAS数据和连锁窗口大小(kb)及连锁系数(r2),获取与指定SNP存在连锁不平衡的其他SNP。可以使用千人基因组(1000G)参考面板数据文件来进行连锁不平衡计算。
Usage
clump_LD_R2(
dat,
snp_col = "SNP",
clump_kb = 1000,
clump_r2 = 0.01,
bfile_1000G = "G:/QTLMR_test/1kg.v3/EUR"
)
Arguments
- dat
输入的GWAS数据,必须为数据框(data frame)。
- snp_col
字符串,指定SNP列的名称。
- clump_kb
数值,指定连锁窗口大小范围,默认为1000。
- clump_r2
数值,指定连锁系数r2的大小,默认为0.2。该参数控制连锁不平衡的筛选标准。
- bfile_1000G
字符串,指定千人基因组参考面板数据文件的路径。避免使用MAF > 0.01版本。完整版下载地址:http://fileserve.mrcieu.ac.uk/ld/1kg.v3.tgz。
Value
返回与输入数据中SNP具有连锁不平衡的SNP列表。
Details
该函数通过调用Plink软件,使用千人基因组数据计算连锁不平衡(LD)并筛选出与输入SNP存在显著LD的其他SNP。用户可以根据需要调整窗口大小(clump_kb)和r2阈值(clump_r2)来控制连锁不平衡的筛选标准。