使用S-PrediXcan软件进行TWAS分析
JTI_SPrediXcan_test.Rd
软件官网:https://github.com/hakyimlab/MetaXcan/tree/master
Usage
JTI_SPrediXcan_test(
test_help = FALSE,
GTEX_tissue = "all",
model_db_path = "./JTI",
covariance = "./JTI",
gwas_folder = "./",
gwas_file_pattern = "SNP_gwas_mc_merge_nogc.tbl.uniq",
snp_column = "SNP",
effect_allele_column = "A1",
non_effect_allele_column = "A2",
beta_column = "b",
se_column = "se",
opt_arguments = NULL,
FDR_method = "bonferroni",
save_path = "./",
cores = 1
)
Arguments
- test_help
是否调阅SPrediXcan.py的帮助文档,默认FALSE。
- GTEX_tissue
GTEx v8组织类型,默认"all",即对所有组织分析,也可指定组织,如"JTI_Whole_Blood"。
- model_db_path
字符串,预测模型所在文件夹的路径。
- covariance
字符串,包含协方差数据的文件夹的路径。
- gwas_folder
包含GWAS汇总统计数据的文件夹。
- gwas_file_pattern
GWAS文件名。
- snp_column
包含RSID的列名。
- effect_allele_column
包含效应等位基因的列名。
- non_effect_allele_column
包含非效应等位基因的列名。
- beta_column
输入GWAS文件中包含每个SNP效应值的列名。
- se_column
输入GWAS文件中包含每个SNP 标准方差的列名。
- opt_arguments
SPrediXcan.py的其他命令行参数(设置test_help=TRUE查看),默认NULL。
- FDR_method
对P值进行FDR矫正方法,"fdr"或"bonferroni",默认"bonferroni"。
- save_path
文件保存路径。
- cores
并行运算电脑的线程数。
Value
生成一个 CSV 结果文件,每行代表一个基因在特定表型-组织组合下的关联分析结果,包含以下字段:
gene: 基因 ID(ENSEMBL ID 或内含子 ID)。
gene_name: 基因名称(HUGO 标准命名)或内含子 ID。
zscore: 预测的关联 z 评分,表示基因表达或剪切与表型的关联方向和强度。
effect_size: 估计的效应值,表示基因表达或剪切水平变化对表型的影响大小。
pvalue: 关联分析的 p 值,评估基因表达或剪切水平与表型的统计显著性。
var_g: 预测表达或剪切水平的方差估计,计算公式为 W' * G * W,其中 W 为基因模型中的 SNP 权重向量,W' 为其转置,G 为 GWAS SNP 之间的 LD 矩阵。
pred_perf_r2: 预测模型的交叉验证决定系数 R²,衡量模型在独立数据集上的解释能力。
pred_perf_pval: 预测模型的交叉验证 p 值,衡量模型预测性能的统计显著性。
pred_perf_qval: 该字段已废弃,仅保留为空字段以保持兼容性。
n_snps_used: 该模型中与 GWAS 数据集交叉的 SNP 数量。
n_snps_in_cov: 用于 LD 计算的 SNP 总数。
n_snps_in_model: 该基因表达预测模型中包含的 SNP 总数。
best_gwas_p: 该模型中使用的 SNP 中最小的 GWAS p 值,反映最显著的单 SNP 关联。
largest_weight: 预测模型中绝对值最大的 SNP 权重,表明最具影响力的 SNP 对基因表达预测的贡献。