对 GWAS 结果的基因型插补(Imputation)以适配 MetaXcan 分析
MetaXcan_imputation.Rd
该函数用于对 GWAS 结果进行基因型插补,以提高 GWAS 数据的完整性和分析精度,并适配 MetaXcan 工具进行后续基因表达预测分析, 详见:https://github.com/hakyimlab/MetaXcan/wiki/Tutorial:-GTEx-v8-MASH-models-integration-with-a-Coronary-Artery-Disease-GWAS
Usage
MetaXcan_imputation(
gwas_file = "./bmi_MTAG.txt.gz",
by_region_file = "./data/eur_ld.bed.gz",
parquet_genotype = "./data/reference_panel_1000G",
window = 1e+05,
parsimony = 7,
start_chr = 1,
end_chr = 22,
regularization = 0.1,
frequency_filter = 0.01,
sub_batches = 10,
cores = 1,
imputation_postproces = TRUE,
save_name = "bmi_MTAG",
save_path = "./imputation"
)
Arguments
- gwas_file
字符串,MetaXcan_Harmonization()结果文件的路径(默认 "./XXX_MTAG.txt.gz")。
- by_region_file
字符串,按区域划分的坐标转换文件路径(默认 "./sample_data/data/eur_ld.bed.gz")。
- parquet_genotype
字符串,基因型数据的 Parquet 格式文件所在目录(默认 "./sample_data/data/reference_panel_1000G")。
- window
数值,插补时使用的窗口大小(碱基对单位,默认 100000)。
- parsimony
数值,MetaXcan 插补算法的简约度参数,影响插补计算的详细程度(默认 7)。
- start_chr
数值,起始染色体编号(默认 1)。
- end_chr
数值,终止染色体编号(默认 22)。
- regularization
数值,插补模型的正则化参数(默认 0.1)。
- frequency_filter
数值,SNP 频率过滤阈值,低于该值的 SNP 将被过滤(默认 0.01)。
- sub_batches
数值,将 GWAS 结果分为多少个子批次进行插补计算(默认 10)。
- cores
数值,运行时使用的 CPU 核心数(自用电脑建议默认 1,表示单线程计算;服务器建议 >1 时采用并行计算)。
- imputation_postproces
逻辑值,是否进行插补后合并处理(默认 TRUE)。
- save_name
字符串,输出文件的基础名称(默认 "bmi_MTAG")。
- save_path
字符串,输出文件的存储路径(默认 "./imputation")。如果路径不存在,则会自动创建。