Skip to contents

该函数基于1000基因组(1000 Genomes)参考数据,提取结局数据,并寻找与给定SNP相关的代理SNP。支持根据连锁不平衡(r2)、SNP数量、次要等位基因频率(MAF)等条件进行筛选。

Usage

modified_proxy_1000G(
  snps,
  GWASfile = " ",
  proxies = T,
  rsq = 0.8,
  kb = 5000,
  nsnp = 5000,
  maf_threshold = 0.3,
  bfile_1000G = "./1.data/1000G/EUR"
)

Arguments

snps

暴露数据的SNP。

GWASfile

TwosampleMR格式的完整结局数据路径,包含目标数据。

proxies

是否寻找代理的SNP,默认为TRUE。

rsq

代理SNP连锁不平衡(r2)过滤阈值,默认值为0.8。低于该阈值的SNP将被过滤掉。

kb

连锁不平衡窗口大小,单位为碱基对(bp),默认值为5000。

nsnp

SNP的数量,默认值为5000。用于限制提取的SNP数量。

maf_threshold

次要等位基因频率(MAF)过滤阈值,默认值为0.3。低于该阈值的SNP将被过滤掉。

bfile_1000G

千人基因组参考面板数据文件的前缀路径(如:./1.data/1000G/EUR)。这个文件应包含1000G的SNP数据。

Value

返回经过处理和过滤后的数据。