Skip to contents

调用TWAS_fusion_assoc_test函数循环分析如GTEx_v8多种组织。

Usage

TWAS_fusion_Multi_test(
  Sumstatsfile = "PGC2.SCZ.sumstats",
  weights_type = "nofilter.pos",
  weights_dir = "./WEIGHTS/",
  resource = "GTEx_v8",
  ref_ld_chr = "./LDREF/1000G.EUR.",
  start_chr = 1,
  end_chr = 22,
  coloc_pval = NULL,
  GWASN = NULL,
  perm = 10000,
  PANELN = NA,
  opt_arguments = NULL,
  remove_MHC = TRUE,
  FDR_method = "bonferroni",
  save_name = "SCZ",
  save_path = "./SCZ",
  cores = 1
)

Arguments

Sumstatsfile

.sumstats.gz格式文件路径。使用TWAS_fusion_format_data()函数转换获得。

weights_type

权重数据文件类型,"nofilter.pos" 或"pos" ,默认"nofilter.pos"。

weights_dir

权重数据文件所在的文件夹。

resource

权重数据文件来源,"GTEx_v8"或"other",默认"GTEx_v8"。

ref_ld_chr

连锁不平衡的参考数据,下载地址:https://alkesgroup.broadinstitute.org/FUSION/LDREF.tar.bz2。

start_chr

需要分析的染色体起始序号。

end_chr

需要分析的染色体终止序号。

coloc_pval

根据TWAS显著阈值筛选进行共定位分析,默认不进行共定位分析设置:NULL,常规设置为0.05。

GWASN

GWAS即Sumstatsfile数据的样本量,默认不进行共定位分析设置:NULL。

perm

设置置换检验次数,默认值是10000。

PANELN

参考面板的权重数据,默认为NA。

opt_arguments

FUSION软件FUSION.assoc_test的其他命令行参数(如TWAS_fusion_assoc_test函数设置),默认NULL。

remove_MHC

是否移除MHC区域的SNP。

FDR_method

对TWAS.P值进行FDR矫正方法,"fdr"或"bonferroni",默认"bonferroni",若填NULL则不进行FDR矫正。

save_name

保存文件的文件名称。

save_path

文件保存路径。

cores

并行运算电脑的线程数。

Value

生成多个 CSV 结果文件,每行代表一个基因在特定表型下的 TWAS(Transcriptome-Wide Association Study)分析结果,包含以下字段:

  • FILE: 使用的参考权重文件的完整路径。

  • ID: 基因或功能元件的标识符,来源于 –weights 文件(例如 FAM109B)。

  • CHR: 所在染色体编号。

  • P0: 基因起始位置(基于 –weights 文件)。

  • P1: 基因终止位置(基于 –weights 文件)。

  • HSQ: 该基因的遗传力(heritability)。

  • BEST.GWAS.ID: 在该基因座内最显著 GWAS SNP 的 rsID。

  • BEST.GWAS.Z: 该 GWAS SNP 的 Z-score,反映其与表型的关联强度。

  • EQTL.ID: 该基因座内最显著 eQTL(表达数量性状位点)的 rsID。

  • EQTL.R2: 该 eQTL 的交叉验证 R²,表示其预测能力。

  • EQTL.Z: 该 eQTL 的 Z-score,衡量基因表达与基因型的关联强度。

  • EQTL.GWAS.Z: 该 eQTL 在 GWAS 中的 Z-score,反映其在表型中的作用。

  • NSNP: 该基因座内的 SNP 数量。

  • MODEL: 最优模型(例如 Lasso)。

  • MODELCV.R2: 该模型的交叉验证 R²,评估其预测性能。

  • MODELCV.PV: 该模型的交叉验证 P 值,评估其预测显著性。

  • TWAS.Z: 主要分析统计量,即 TWAS Z-score,表示该基因表达对表型的预测关联强度。

  • TWAS.P: 主要分析统计量,即 TWAS P 值,评估该基因表达与表型的统计学显著性。。