Skip to contents

该函数用于对 GWAS 结果进行基因型插补,以提高 GWAS 数据的完整性和分析精度,并适配 MetaXcan 工具进行后续基因表达预测分析, 详见:https://github.com/hakyimlab/MetaXcan/wiki/Tutorial:-GTEx-v8-MASH-models-integration-with-a-Coronary-Artery-Disease-GWAS

Usage

MetaXcan_imputation(
  gwas_file = "./bmi_MTAG.txt.gz",
  by_region_file = "./data/eur_ld.bed.gz",
  parquet_genotype = "./data/reference_panel_1000G",
  window = 1e+05,
  parsimony = 7,
  start_chr = 1,
  end_chr = 22,
  regularization = 0.1,
  frequency_filter = 0.01,
  sub_batches = 10,
  cores = 1,
  imputation_postproces = TRUE,
  save_name = "bmi_MTAG",
  save_path = "./imputation"
)

Arguments

gwas_file

字符串,MetaXcan_Harmonization()结果文件的路径(默认 "./XXX_MTAG.txt.gz")。

by_region_file

字符串,按区域划分的坐标转换文件路径(默认 "./sample_data/data/eur_ld.bed.gz")。

parquet_genotype

字符串,基因型数据的 Parquet 格式文件所在目录(默认 "./sample_data/data/reference_panel_1000G")。

window

数值,插补时使用的窗口大小(碱基对单位,默认 100000)。

parsimony

数值,MetaXcan 插补算法的简约度参数,影响插补计算的详细程度(默认 7)。

start_chr

数值,起始染色体编号(默认 1)。

end_chr

数值,终止染色体编号(默认 22)。

regularization

数值,插补模型的正则化参数(默认 0.1)。

frequency_filter

数值,SNP 频率过滤阈值,低于该值的 SNP 将被过滤(默认 0.01)。

sub_batches

数值,将 GWAS 结果分为多少个子批次进行插补计算(默认 10)。

cores

数值,运行时使用的 CPU 核心数(自用电脑建议默认 1,表示单线程计算;服务器建议 >1 时采用并行计算)。

imputation_postproces

逻辑值,是否进行插补后合并处理(默认 TRUE)。

save_name

字符串,输出文件的基础名称(默认 "bmi_MTAG")。

save_path

字符串,输出文件的存储路径(默认 "./imputation")。如果路径不存在,则会自动创建。

Value

无返回值,函数将在指定路径生成插补后的 GWAS 结果文件。