Skip to contents

软件官网:https://github.com/hakyimlab/MetaXcan/tree/master

Usage

JTI_SPrediXcan_test(
  test_help = FALSE,
  GTEX_tissue = "all",
  model_db_path = "./JTI",
  covariance = "./JTI",
  gwas_folder = "./",
  gwas_file_pattern = "SNP_gwas_mc_merge_nogc.tbl.uniq",
  snp_column = "SNP",
  effect_allele_column = "A1",
  non_effect_allele_column = "A2",
  beta_column = "b",
  se_column = "se",
  opt_arguments = NULL,
  FDR_method = "bonferroni",
  save_path = "./",
  cores = 1
)

Arguments

test_help

是否调阅SPrediXcan.py的帮助文档,默认FALSE。

GTEX_tissue

GTEx v8组织类型,默认"all",即对所有组织分析,也可指定组织,如"JTI_Whole_Blood"。

model_db_path

字符串,预测模型所在文件夹的路径。

covariance

字符串,包含协方差数据的文件夹的路径。

gwas_folder

包含GWAS汇总统计数据的文件夹。

gwas_file_pattern

GWAS文件名。

snp_column

包含RSID的列名。

effect_allele_column

包含效应等位基因的列名。

non_effect_allele_column

包含非效应等位基因的列名。

beta_column

输入GWAS文件中包含每个SNP效应值的列名。

se_column

输入GWAS文件中包含每个SNP 标准方差的列名。

opt_arguments

SPrediXcan.py的其他命令行参数(设置test_help=TRUE查看),默认NULL。

FDR_method

对P值进行FDR矫正方法,"fdr"或"bonferroni",默认"bonferroni"。

save_path

文件保存路径。

cores

并行运算电脑的线程数。

Value

生成一个 CSV 结果文件,每行代表一个基因在特定表型-组织组合下的关联分析结果,包含以下字段:

  • gene: 基因 ID(ENSEMBL ID 或内含子 ID)。

  • gene_name: 基因名称(HUGO 标准命名)或内含子 ID。

  • zscore: 预测的关联 z 评分,表示基因表达或剪切与表型的关联方向和强度。

  • effect_size: 估计的效应值,表示基因表达或剪切水平变化对表型的影响大小。

  • pvalue: 关联分析的 p 值,评估基因表达或剪切水平与表型的统计显著性。

  • var_g: 预测表达或剪切水平的方差估计,计算公式为 W' * G * W,其中 W 为基因模型中的 SNP 权重向量,W' 为其转置,G 为 GWAS SNP 之间的 LD 矩阵。

  • pred_perf_r2: 预测模型的交叉验证决定系数 R²,衡量模型在独立数据集上的解释能力。

  • pred_perf_pval: 预测模型的交叉验证 p 值,衡量模型预测性能的统计显著性。

  • pred_perf_qval: 该字段已废弃,仅保留为空字段以保持兼容性。

  • n_snps_used: 该模型中与 GWAS 数据集交叉的 SNP 数量。

  • n_snps_in_cov: 用于 LD 计算的 SNP 总数。

  • n_snps_in_model: 该基因表达预测模型中包含的 SNP 总数。

  • best_gwas_p: 该模型中使用的 SNP 中最小的 GWAS p 值,反映最显著的单 SNP 关联。

  • largest_weight: 预测模型中绝对值最大的 SNP 权重,表明最具影响力的 SNP 对基因表达预测的贡献。