使用S-PrediXcan软件进行TWAS分析 — JTI_SPrediXcan

软件官网：https://github.com/hakyimlab/MetaXcan/tree/master

Usage

JTI_SPrediXcan_test(
  test_help = FALSE,
  GTEX_tissue = "all",
  model_db_path = "./JTI",
  covariance = "./JTI",
  gwas_folder = "./",
  gwas_file_pattern = "SNP_gwas_mc_merge_nogc.tbl.uniq",
  snp_column = "SNP",
  effect_allele_column = "A1",
  non_effect_allele_column = "A2",
  beta_column = "b",
  se_column = "se",
  opt_arguments = NULL,
  FDR_method = "bonferroni",
  save_path = "./",
  cores = 1
)

Arguments

test_help: 逻辑值，是否调阅SPrediXcan.py的帮助文档，默认值为FALSE。
GTEX_tissue: 字符串或字符向量，GTEx v8组织类型，默认"all"，即对所有组织进行分析，也可指定特定组织，如"JTI_Whole_Blood"。
model_db_path: 字符串，预测模型所在文件夹的路径。
covariance: 字符串，包含协方差数据的文件夹路径。
gwas_folder: 字符串，包含GWAS汇总统计数据的文件夹路径。
gwas_file_pattern: 字符串，GWAS文件名的匹配模式。
snp_column: 字符串，包含RSID的列名。
effect_allele_column: 字符串，包含效应等位基因的列名。
non_effect_allele_column: 字符串，包含非效应等位基因的列名。
beta_column: 字符串，输入GWAS文件中包含每个SNP效应值的列名。
se_column: 字符串，输入GWAS文件中包含每个SNP标准差的列名。
opt_arguments: 字符串，SPrediXcan.py的其他命令行参数，默认值为NULL。
FDR_method: 字符串，P值的FDR矫正方法，"fdr"或"bonferroni"，默认值为"bonferroni"。
save_path: 字符串，结果文件的保存路径。
cores: 整数，进行并行运算时使用的线程数。

Value

生成一个 CSV 结果文件，每行代表一个基因在特定表型-组织组合下的关联分析结果，包含以下字段：

gene: 基因 ID（ENSEMBL ID 或内含子 ID）。
gene_name: 基因名称（HUGO 标准命名）或内含子 ID。
zscore: 预测的关联 z 评分，表示基因表达或剪切与表型的关联方向和强度。
effect_size: 估计的效应值，表示基因表达或剪切水平变化对表型的影响大小。
pvalue: 关联分析的 p 值，评估基因表达或剪切水平与表型的统计显著性。
var_g: 预测表达或剪切水平的方差估计，计算公式为 W' * G * W，其中 W 为基因模型中的 SNP 权重向量，W' 为其转置，G 为 GWAS SNP 之间的 LD 矩阵。
pred_perf_r2: 预测模型的交叉验证决定系数 R²，衡量模型在独立数据集上的解释能力。
pred_perf_pval: 预测模型的交叉验证 p 值，衡量模型预测性能的统计显著性。
pred_perf_qval: 该字段已废弃，仅保留为空字段以保持兼容性。
n_snps_used: 该模型中与 GWAS 数据集交叉的 SNP 数量。
n_snps_in_cov: 用于 LD 计算的 SNP 总数。
n_snps_in_model: 该基因表达预测模型中包含的 SNP 总数。
best_gwas_p: 该模型中使用的 SNP 中最小的 GWAS p 值，反映最显著的单 SNP 关联。
largest_weight: 预测模型中绝对值最大的 SNP 权重，表明最具影响力的 SNP 对基因表达预测的贡献。