Skip to contents

此函数用于运行 SUPERGNOVA 算法,该算法计算两个性状之间的局部遗传相关性,官网:https://github.com/qlu-lab/SUPERGNOVA。

Usage

SUPERGNOVA_run(
  test_help = FALSE,
  Sumstatsfile = c("ASD.txt.sumstats.gz", "CP.txt.sumstats.gz"),
  trait1_samplesizes = NULL,
  trait2_samplesizes = NULL,
  bfile = "./bfiles/eur_chr@_SNPmaf5",
  partition = "./partition/eur_chr@.bed",
  save_name = "res",
  save_path = "./supergnova",
  thread = NULL
)

Arguments

test_help

是否输出 SUPERGNOVA 的帮助信息。默认为 FALSE。当设置为 TRUE 时,仅显示帮助信息,不执行分析。

Sumstatsfile

包含 GWAS 汇总统计数据的文件路径列表。文件需以 *.sumstats.gz 格式提供,支持多个性状文件。

trait1_samplesizes

第一个性状的样本量。若为空,则不指定此参数。

trait2_samplesizes

第二个性状的样本量。若为空,则不指定此参数。

bfile

参考数据面板文件(LD 文件)的路径前缀,用于计算局部遗传相关性。默认值为 "./bfiles/eur_chr@_SNPmaf5"

partition

分区文件路径前缀,定义局部遗传相关性的区域。默认值为 "./partition/eur_chr@.bed"

save_name

输出结果文件的名称(不包含后缀)。默认值为 "res"

save_path

结果文件的保存路径。默认值为 "./supergnova"

thread

每条染色体运算的线程数,设置为NULL时,则启用所有线程。

Value

分析结果,包含以下列:

  • chr: 染色体编号。

  • start: 该基因组区域的起始位置(来源于输入的基因组分区文件)。

  • end: 该基因组区域的终止位置(来源于输入的基因组分区文件)。

  • rho: 估计的局部遗传协方差(local genetic covariance)。

  • corr: 估计的局部遗传相关性(local genetic correlation)。

  • h2_1: 采用矩估计法(method of moments)计算的第一个性状的局部遗传力估计值(local heritability)。

  • h2_2: 采用矩估计法计算的第二个性状的局部遗传力估计值。

  • var: 局部遗传协方差估计值的方差。

  • p: 局部遗传协方差的 p 值。

  • m: 用于计算该基因组区域局部遗传协方差的 SNP 数目。

注意:某些表型的某些基因组区域的真实遗传力可能非常小。尽管已有方法可用于估计局部遗传力,但在许多情况下,这些方法可能会提供不稳定的估计,甚至得到负的遗传力估计值。 SUPERGNOVA 采用如下策略处理负的遗传力估计值

  • 直接忽略负的遗传力估计值,将相关性估计结果设为 "NA"。

  • 因此,我们建议在局部遗传相关性分析中,优先关注遗传协方差 rho,而非遗传相关性 corr

Details

该分析基于 SUPERGNOVA 方法,利用 GWAS 数据计算局部遗传相关性和协方差,以探讨两个性状在基因组特定区域上的遗传关联性。

输入数据

  • bfile: 指定 .bed/.bim/.fam 格式的基因型数据文件前缀。

    • @ 代表通配符字符,SUPERGNOVA 会自动替换为 1-22 以涵盖所有常染色体。

    • 例如,若有全基因组基因型数据,可指定 bfile = "eur_chr@_SNPmaf5"

  • partition: 指定基因组分区文件(.bed 格式),用于定义分析区域。

    • @ 代表通配符,SUPERGNOVA 会自动替换 1-22

    • 若仅对特定区域感兴趣,可指定一个包含所有目标区域的 .bed 文件,例如 eur_chr1.bed