Skip to contents

该函数读取Pan UKBB数据库的tsv.bgz文件,提取欧洲子集数据并清洗并格式化数据后,保存为TwosampleMR、SMR、METAL、MTAG格式的文件。 注意:运行该功能需要至少32G内存设备。

Usage

format_data_Pan_UKBB(
  GWASfile = "XXX.tsv.bgz",
  Pan_UKb_variants = "Pan_UKBB_variant.txt.gz",
  type = "outcome",
  min_pval = 1e-200,
  low_confidence_SNP = FALSE,
  build_to_hg38 = FALSE,
  Twosample_dat = TRUE,
  SMR_dat = TRUE,
  MTAG_dat = TRUE,
  GWASinspector_dat = TRUE,
  METAL_dat = TRUE,
  GWAS_name = "Pan_UKBB",
  save_path = "./Pan_UKBB"
)

Arguments

GWASfile

字符串,指定Pan UKBB数据库tsv.bgz文件的路径。

Pan_UKb_variants

字符串,SNP注释文件的路径。

type

字符串,Twosample数据的类型,取值为"exposure"或"outcome",默认为"outcome"。

min_pval

数值,允许的最小p值,默认为1e-200

low_confidence_SNP

逻辑值,是否过滤低置信度SNP,默认为FALSE。

build_to_hg38

逻辑值,是否使用liftover函数将GRCh37转换为GRCh38,默认为FALSE

Twosample_dat

逻辑值,是否保存TwosampleMR数据文件,默认为TRUE

SMR_dat

逻辑值,是否保存SMR数据文件,默认为TRUE

MTAG_dat

逻辑值,是否保存MTAG分析输入数据文件,默认为TRUE

GWASinspector_dat

逻辑值,指定是否保存GWASinspector分析输入数据文件,默认为FALSE

METAL_dat

逻辑值,是否保存METAL分析输入数据文件,默认为TRUE

GWAS_name

字符串,指定输出文件的名称。

save_path

字符串,指定输出文件保存的目录路径,默认为当前工作目录。

Value

返回TwosampleMR格式的数据。