提取Pan UKBB数据库tsv.bgz文件的欧洲子集数据并清洗与格式转换
format_data_Pan_UKBB.Rd
该函数读取Pan UKBB数据库的tsv.bgz文件,提取欧洲子集数据并清洗并格式化数据后,保存为TwosampleMR、SMR、METAL、MTAG格式的文件。 注意:运行该功能需要至少32G内存设备。
Usage
format_data_Pan_UKBB(
GWASfile = "XXX.tsv.bgz",
Pan_UKb_variants = "Pan_UKBB_variant.txt.gz",
type = "outcome",
min_pval = 1e-200,
low_confidence_SNP = FALSE,
build_to_hg38 = FALSE,
Twosample_dat = TRUE,
SMR_dat = TRUE,
MTAG_dat = TRUE,
GWASinspector_dat = TRUE,
METAL_dat = TRUE,
GWAS_name = "Pan_UKBB",
save_path = "./Pan_UKBB"
)
Arguments
- GWASfile
字符串,指定Pan UKBB数据库tsv.bgz文件的路径。
- Pan_UKb_variants
字符串,SNP注释文件的路径。
- type
字符串,Twosample数据的类型,取值为"exposure"或"outcome",默认为"outcome"。
- min_pval
数值,允许的最小p值,默认为
1e-200
。- low_confidence_SNP
逻辑值,是否过滤低置信度SNP,默认为FALSE。
- build_to_hg38
逻辑值,是否使用liftover函数将GRCh37转换为GRCh38,默认为
FALSE
。- Twosample_dat
逻辑值,是否保存TwosampleMR数据文件,默认为
TRUE
。- SMR_dat
逻辑值,是否保存SMR数据文件,默认为
TRUE
。- MTAG_dat
逻辑值,是否保存MTAG分析输入数据文件,默认为
TRUE
。- GWASinspector_dat
逻辑值,指定是否保存GWASinspector分析输入数据文件,默认为
FALSE
。- METAL_dat
逻辑值,是否保存METAL分析输入数据文件,默认为
TRUE
。- GWAS_name
字符串,指定输出文件的名称。
- save_path
字符串,指定输出文件保存的目录路径,默认为当前工作目录。