使用 FUSION 软件进行 Joint/Conditional 分析
TWAS_fusion_conditonal_test.Rd
通过分析基因表达和其他 GWAS 数据,用户可以发现与表型相关的潜在驱动基因。
FUSION 软件的官网链接:FUSION Software。
Usage
TWAS_fusion_conditonal_test(
test_help = FALSE,
Sumstatsfile = "PGC2.SCZ.sumstats",
inputfile = "./SCZ/SCZ_sig.dat",
ref_ld_chr = "./LDREF/1000G.EUR.",
start_chr = 1,
end_chr = 22,
locus_win_kb = 1000,
build = 38,
plot_legend = "all",
opt_arguments = NULL,
save_name = "SCZ",
save_path = "./SCZ/conditional",
cores = 2
)
Arguments
- test_help
逻辑值,是否调阅 FUSION 软件的
FUSION.post_process
帮助文档,默认为FALSE
。- Sumstatsfile
字符串,GWAS 总结统计数据文件的路径,要求为
.sumstats.gz
格式。可通过TWAS_fusion_format_data()
函数格式化获得。- inputfile
字符串,
TWAS_fusion_assoc_test
函数分析生成的XXX_sig.dat
文件的路径。- ref_ld_chr
字符串,指定连锁不平衡(LD)参考数据的路径,数据可从 FUSION LD 参考数据 下载。
- start_chr
整数,指定分析的起始染色体编号,取值范围为 1 至 22。
- end_chr
整数,指定分析的终止染色体编号,取值范围为 1 至 22。
- locus_win_kb
数值,区域图的 kb 值大小,默认值为 1000 kb(即 1000000 bp)。
- build
整数,参考基因组版本,支持 37 或 38,默认为 38。
- plot_legend
字符串,图例的类型,选项包括 "all" 或 "joint",默认为 "all"。
- opt_arguments
字符串或
NULL
,传递给 FUSION 软件FUSION.post_process
函数的其他命令行参数,若设置test_help = TRUE
,则可以查看可用的参数。- save_name
字符串,结果文件的保存名称。
- save_path
字符串,结果文件保存的路径。
- cores
整数,计算时使用的线程数,默认为 2。可以设置更高的线程数以加速分析。
Value
返回包含分析结果的多个输出文件。
该过程将读取所选基因的 表达加权数据,并将其整合到 重叠基因组区域(loci) 中(基于 --locus_win
定义的边界)。随后,程序会生成多个条件输出,并绘制以下 总结图:
上面面板:显示了该基因区域内的所有基因。所有与 TWAS 关联的基因(包括 marginally 关联)以蓝色标记,与 X基因 等共同显著的基因以绿色标出。
程序会输出名为
*.joint_included.dat
的文件,包含这些共同显著基因的 联合效应估计和 P 值。对于那些因条件非显著而被移除的基因,相关数据会输出到对应的
*.joint_dropped.dat
文件中,包含 条件效应估计和 P 值。
下面面板:显示了在对 X基因 的基因表达进行条件分析前后的 GWAS 曼哈顿图:
条件前的 GWAS 数据以灰色表示,条件后的数据(考虑了 X基因 的基因表达)则以蓝色表示。您可以看到该区域的信号在进行条件分析后从 全基因组显著 变为 非显著,表明 X基因 的基因表达可能是驱动该GWAS信号的关键因素。