使用FUSION软件进行Joint/conditional分析
TWAS_fusion_conditonal_test.Rd
软件官网:http://gusevlab.org/projects/fusion/。
Usage
TWAS_fusion_conditonal_test(
test_help = FALSE,
Sumstatsfile = "PGC2.SCZ.sumstats",
inputfile = "./SCZ/SCZ_sig.dat",
ref_ld_chr = "./LDREF/1000G.EUR.",
start_chr = 1,
end_chr = 22,
locus_win_kb = 1000,
build = 38,
plot_legend = "all",
opt_arguments = NULL,
save_name = "SCZ",
save_path = "./SCZ/conditional",
cores = 2
)
Arguments
- test_help
是否调阅FUSION软件FUSION.post_process的帮助文档,默认FALSE。
- Sumstatsfile
.sumstats.gz格式文件路径。使用TWAS_fusion_format_data()函数转换获得。
- inputfile
TWAS_fusion_assoc_test分析生成的"XXX_sig.dat"文件路径。
- ref_ld_chr
连锁不平衡的参考数据,下载地址:https://alkesgroup.broadinstitute.org/FUSION/LDREF.tar.bz2。
- start_chr
需要分析的染色体起始序号。
- end_chr
需要分析的染色体终止序号。
- locus_win_kb
区域图的kb值大小,默认1000kb,即1000000bp。
- build
37或38,人类参考基因组版本,默认38。
- plot_legend
添加图例的类型,"all"或"joint",默认"all"。
- opt_arguments
FUSION软件FUSION.post_process的其他命令行参数(设置test_help = TRUE查看参数),默认NULL。
- save_name
保存文件的文件名称。
- save_path
文件保存路径。
- cores
并行运算电脑的线程数。
Value
返回包含分析结果的多个输出文件。
该过程将读取所选基因的 表达加权数据,并将其整合到 重叠基因组区域(loci) 中(基于 --locus_win
定义的边界)。随后,程序会生成多个条件输出,并绘制以下 总结图:
上面面板:显示了该基因区域内的所有基因。所有与 TWAS 关联的基因(包括 marginally 关联)以蓝色标记,与 X基因 等共同显著的基因以绿色标出。
程序会输出名为
*.joint_included.dat
的文件,包含这些共同显著基因的 联合效应估计和 P 值。对于那些因条件非显著而被移除的基因,相关数据会输出到对应的
*.joint_dropped.dat
文件中,包含 条件效应估计和 P 值。
下面面板:显示了在对 X基因 的基因表达进行条件分析前后的 GWAS 曼哈顿图:
条件前的 GWAS 数据以灰色表示,条件后的数据(考虑了 X基因 的基因表达)则以蓝色表示。您可以看到该区域的信号在进行条件分析后从 全基因组显著 变为 非显著,表明 X基因 的基因表达可能是驱动该GWAS信号的关键因素。