使用FUSION软件进行循环多种组织分析
TWAS_fusion_Multi_test.Rd
调用TWAS_fusion_assoc_test函数循环分析如GTEx_v8多种组织。
Usage
TWAS_fusion_Multi_test(
Sumstatsfile = "PGC2.SCZ.sumstats",
weights_type = "nofilter.pos",
weights_dir = "./WEIGHTS/",
resource = "GTEx_v8",
ref_ld_chr = "./LDREF/1000G.EUR.",
start_chr = 1,
end_chr = 22,
coloc_pval = NULL,
GWASN = NULL,
perm = 10000,
PANELN = NA,
opt_arguments = NULL,
remove_MHC = TRUE,
FDR_method = "bonferroni",
save_name = "SCZ",
save_path = "./SCZ",
cores = 1
)
Arguments
- Sumstatsfile
.sumstats.gz格式文件路径。使用TWAS_fusion_format_data()函数转换获得。
- weights_type
权重数据文件类型,"nofilter.pos" 或"pos" ,默认"nofilter.pos"。
- weights_dir
权重数据文件所在的文件夹。
- resource
权重数据文件来源,"GTEx_v8"或"other",默认"GTEx_v8"。
- ref_ld_chr
连锁不平衡的参考数据,下载地址:https://alkesgroup.broadinstitute.org/FUSION/LDREF.tar.bz2。
- start_chr
需要分析的染色体起始序号。
- end_chr
需要分析的染色体终止序号。
- coloc_pval
根据TWAS显著阈值筛选进行共定位分析,默认不进行共定位分析设置:NULL,常规设置为0.05。
- GWASN
GWAS即Sumstatsfile数据的样本量,默认不进行共定位分析设置:NULL。
- perm
设置置换检验次数,默认值是10000。
- PANELN
参考面板的权重数据,默认为NA。
- opt_arguments
FUSION软件FUSION.assoc_test的其他命令行参数(如TWAS_fusion_assoc_test函数设置),默认NULL。
- remove_MHC
是否移除MHC区域的SNP。
- FDR_method
对TWAS.P值进行FDR矫正方法,"fdr"或"bonferroni",默认"bonferroni",若填NULL则不进行FDR矫正。
- save_name
保存文件的文件名称。
- save_path
文件保存路径。
- cores
并行运算电脑的线程数。
Value
生成多个 CSV 结果文件,每行代表一个基因在特定表型下的 TWAS(Transcriptome-Wide Association Study)分析结果,包含以下字段:
FILE: 使用的参考权重文件的完整路径。
ID: 基因或功能元件的标识符,来源于 –weights 文件(例如 FAM109B)。
CHR: 所在染色体编号。
P0: 基因起始位置(基于 –weights 文件)。
P1: 基因终止位置(基于 –weights 文件)。
HSQ: 该基因的遗传力(heritability)。
BEST.GWAS.ID: 在该基因座内最显著 GWAS SNP 的 rsID。
BEST.GWAS.Z: 该 GWAS SNP 的 Z-score,反映其与表型的关联强度。
EQTL.ID: 该基因座内最显著 eQTL(表达数量性状位点)的 rsID。
EQTL.R2: 该 eQTL 的交叉验证 R²,表示其预测能力。
EQTL.Z: 该 eQTL 的 Z-score,衡量基因表达与基因型的关联强度。
EQTL.GWAS.Z: 该 eQTL 在 GWAS 中的 Z-score,反映其在表型中的作用。
NSNP: 该基因座内的 SNP 数量。
MODEL: 最优模型(例如 Lasso)。
MODELCV.R2: 该模型的交叉验证 R²,评估其预测性能。
MODELCV.PV: 该模型的交叉验证 P 值,评估其预测显著性。
TWAS.Z: 主要分析统计量,即 TWAS Z-score,表示该基因表达对表型的预测关联强度。
TWAS.P: 主要分析统计量,即 TWAS P 值,评估该基因表达与表型的统计学显著性。。