Skip to contents

软件官网:http://gusevlab.org/projects/fusion/。

Usage

TWAS_fusion_conditonal_test(
  test_help = FALSE,
  Sumstatsfile = "PGC2.SCZ.sumstats",
  inputfile = "./SCZ/SCZ_sig.dat",
  ref_ld_chr = "./LDREF/1000G.EUR.",
  start_chr = 1,
  end_chr = 22,
  locus_win_kb = 1000,
  build = 38,
  plot_legend = "all",
  opt_arguments = NULL,
  save_name = "SCZ",
  save_path = "./SCZ/conditional",
  cores = 2
)

Arguments

test_help

是否调阅FUSION软件FUSION.post_process的帮助文档,默认FALSE。

Sumstatsfile

.sumstats.gz格式文件路径。使用TWAS_fusion_format_data()函数转换获得。

inputfile

TWAS_fusion_assoc_test分析生成的"XXX_sig.dat"文件路径。

ref_ld_chr

连锁不平衡的参考数据,下载地址:https://alkesgroup.broadinstitute.org/FUSION/LDREF.tar.bz2。

start_chr

需要分析的染色体起始序号。

end_chr

需要分析的染色体终止序号。

locus_win_kb

区域图的kb值大小,默认1000kb,即1000000bp。

build

37或38,人类参考基因组版本,默认38。

plot_legend

添加图例的类型,"all"或"joint",默认"all"。

opt_arguments

FUSION软件FUSION.post_process的其他命令行参数(设置test_help = TRUE查看参数),默认NULL。

save_name

保存文件的文件名称。

save_path

文件保存路径。

cores

并行运算电脑的线程数。

Value

返回包含分析结果的多个输出文件。

该过程将读取所选基因的 表达加权数据,并将其整合到 重叠基因组区域(loci) 中(基于 --locus_win 定义的边界)。随后,程序会生成多个条件输出,并绘制以下 总结图

  • 上面面板:显示了该基因区域内的所有基因。所有与 TWAS 关联的基因(包括 marginally 关联)以蓝色标记,与 X基因 等共同显著的基因以绿色标出。

    • 程序会输出名为 *.joint_included.dat 的文件,包含这些共同显著基因的 联合效应估计和 P 值

    • 对于那些因条件非显著而被移除的基因,相关数据会输出到对应的 *.joint_dropped.dat 文件中,包含 条件效应估计和 P 值

  • 下面面板:显示了在对 X基因 的基因表达进行条件分析前后的 GWAS 曼哈顿图

    • 条件前的 GWAS 数据以灰色表示,条件后的数据(考虑了 X基因 的基因表达)则以蓝色表示。您可以看到该区域的信号在进行条件分析后从 全基因组显著 变为 非显著,表明 X基因 的基因表达可能是驱动该GWAS信号的关键因素。