对 GWAS 结果的基因型插补（Imputation）以适配 MetaXcan 分析

该函数用于对 GWAS 结果进行基因型插补，以提高 GWAS 数据的完整性和分析精度，并适配 MetaXcan 工具进行后续基因表达预测分析，详见：https://github.com/hakyimlab/MetaXcan/wiki/Tutorial:-GTEx-v8-MASH-models-integration-with-a-Coronary-Artery-Disease-GWAS

Usage

MetaXcan_imputation(
  gwas_file = "./bmi_MTAG.txt.gz",
  by_region_file = "./data/eur_ld.bed.gz",
  parquet_genotype = "./data/reference_panel_1000G",
  window = 1e+05,
  parsimony = 7,
  start_chr = 1,
  end_chr = 22,
  regularization = 0.1,
  frequency_filter = 0.01,
  sub_batches = 10,
  cores = 1,
  imputation_postproces = TRUE,
  save_name = "bmi_MTAG",
  save_path = "./imputation"
)

Arguments

gwas_file: 字符串，MetaXcan_Harmonization()结果文件的路径（默认 "./XXX_MTAG.txt.gz"）。
by_region_file: 字符串，按区域划分的坐标转换文件路径（默认 "./sample_data/data/eur_ld.bed.gz"）。
parquet_genotype: 字符串，基因型数据的 Parquet 格式文件所在目录（默认 "./sample_data/data/reference_panel_1000G")。
window: 数值，插补时使用的窗口大小（碱基对单位，默认 100000）。
parsimony: 数值，MetaXcan 插补算法的简约度参数，影响插补计算的详细程度（默认 7）。
start_chr: 数值，起始染色体编号（默认 1）。
end_chr: 数值，终止染色体编号（默认 22）。
regularization: 数值，插补模型的正则化参数（默认 0.1）。
frequency_filter: 数值，SNP 频率过滤阈值，低于该值的 SNP 将被过滤（默认 0.01）。
sub_batches: 数值，将 GWAS 结果分为多少个子批次进行插补计算（默认 10）。
cores: 数值，运行时使用的 CPU 核心数（自用电脑建议默认 1，表示单线程计算；服务器建议 >1 时采用并行计算）。
imputation_postproces: 逻辑值，是否进行插补后合并处理（默认 TRUE）。
save_name: 字符串，输出文件的基础名称（默认 "bmi_MTAG"）。
save_path: 字符串，输出文件的存储路径（默认 "./imputation"）。如果路径不存在，则会自动创建。

Value

无返回值，函数将在指定路径生成插补后的 GWAS 结果文件。