Skip to contents

通过分析基因表达和其他 GWAS 数据,用户可以发现与表型相关的潜在驱动基因。

FUSION 软件的官网链接:FUSION Software

Usage

TWAS_fusion_conditonal_test(
  test_help = FALSE,
  Sumstatsfile = "PGC2.SCZ.sumstats",
  inputfile = "./SCZ/SCZ_sig.dat",
  ref_ld_chr = "./LDREF/1000G.EUR.",
  start_chr = 1,
  end_chr = 22,
  locus_win_kb = 1000,
  build = 38,
  plot_legend = "all",
  opt_arguments = NULL,
  save_name = "SCZ",
  save_path = "./SCZ/conditional",
  cores = 2
)

Arguments

test_help

逻辑值,是否调阅 FUSION 软件的 FUSION.post_process 帮助文档,默认为 FALSE

Sumstatsfile

字符串,GWAS 总结统计数据文件的路径,要求为 .sumstats.gz 格式。可通过 TWAS_fusion_format_data() 函数格式化获得。

inputfile

字符串,TWAS_fusion_assoc_test 函数分析生成的 XXX_sig.dat 文件的路径。

ref_ld_chr

字符串,指定连锁不平衡(LD)参考数据的路径,数据可从 FUSION LD 参考数据 下载。

start_chr

整数,指定分析的起始染色体编号,取值范围为 1 至 22。

end_chr

整数,指定分析的终止染色体编号,取值范围为 1 至 22。

locus_win_kb

数值,区域图的 kb 值大小,默认值为 1000 kb(即 1000000 bp)。

build

整数,参考基因组版本,支持 37 或 38,默认为 38。

plot_legend

字符串,图例的类型,选项包括 "all" 或 "joint",默认为 "all"。

opt_arguments

字符串或 NULL,传递给 FUSION 软件 FUSION.post_process 函数的其他命令行参数,若设置 test_help = TRUE,则可以查看可用的参数。

save_name

字符串,结果文件的保存名称。

save_path

字符串,结果文件保存的路径。

cores

整数,计算时使用的线程数,默认为 2。可以设置更高的线程数以加速分析。

Value

返回包含分析结果的多个输出文件。

该过程将读取所选基因的 表达加权数据,并将其整合到 重叠基因组区域(loci) 中(基于 --locus_win 定义的边界)。随后,程序会生成多个条件输出,并绘制以下 总结图

  • 上面面板:显示了该基因区域内的所有基因。所有与 TWAS 关联的基因(包括 marginally 关联)以蓝色标记,与 X基因 等共同显著的基因以绿色标出。

    • 程序会输出名为 *.joint_included.dat 的文件,包含这些共同显著基因的 联合效应估计和 P 值

    • 对于那些因条件非显著而被移除的基因,相关数据会输出到对应的 *.joint_dropped.dat 文件中,包含 条件效应估计和 P 值

  • 下面面板:显示了在对 X基因 的基因表达进行条件分析前后的 GWAS 曼哈顿图

    • 条件前的 GWAS 数据以灰色表示,条件后的数据(考虑了 X基因 的基因表达)则以蓝色表示。您可以看到该区域的信号在进行条件分析后从 全基因组显著 变为 非显著,表明 X基因 的基因表达可能是驱动该GWAS信号的关键因素。