本地数据提取结局数据并基于千人基因组代理SNP
modified_proxy_1000G.Rd
该函数基于1000基因组(1000 Genomes)参考数据,提取结局数据,并寻找与给定SNP相关的代理SNP。支持根据连锁不平衡(r2)、SNP数量、次要等位基因频率(MAF)等条件进行筛选。
Usage
modified_proxy_1000G(
snps,
GWASfile = " ",
proxies = T,
rsq = 0.8,
kb = 5000,
nsnp = 5000,
maf_threshold = 0.3,
bfile_1000G = "./1.data/1000G/EUR"
)
Arguments
- snps
暴露数据的SNP。
- GWASfile
TwosampleMR格式的完整结局数据路径,包含目标数据。
- proxies
是否寻找代理的SNP,默认为TRUE。
- rsq
代理SNP连锁不平衡(r2)过滤阈值,默认值为0.8。低于该阈值的SNP将被过滤掉。
- kb
连锁不平衡窗口大小,单位为碱基对(bp),默认值为5000。
- nsnp
SNP的数量,默认值为5000。用于限制提取的SNP数量。
- maf_threshold
次要等位基因频率(MAF)过滤阈值,默认值为0.3。低于该阈值的SNP将被过滤掉。
- bfile_1000G
千人基因组参考面板数据文件的前缀路径(如:
./1.data/1000G/EUR
)。这个文件应包含1000G的SNP数据。