使用 SUPERGNOVA 进行局部遗传相关性分析
SUPERGNOVA_run.Rd
此函数用于运行 SUPERGNOVA 算法,该算法计算两个性状之间的局部遗传相关性,官网:https://github.com/qlu-lab/SUPERGNOVA。
Usage
SUPERGNOVA_run(
test_help = FALSE,
Sumstatsfile = c("ASD.txt.sumstats.gz", "CP.txt.sumstats.gz"),
trait1_samplesizes = NULL,
trait2_samplesizes = NULL,
bfile = "./bfiles/eur_chr@_SNPmaf5",
partition = "./partition/eur_chr@.bed",
save_name = "res",
save_path = "./supergnova",
thread = NULL
)
Arguments
- test_help
是否输出 SUPERGNOVA 的帮助信息。默认为 FALSE。当设置为 TRUE 时,仅显示帮助信息,不执行分析。
- Sumstatsfile
包含 GWAS 汇总统计数据的文件路径列表。文件需以
*.sumstats.gz
格式提供,支持多个性状文件。- trait1_samplesizes
第一个性状的样本量。若为空,则不指定此参数。
- trait2_samplesizes
第二个性状的样本量。若为空,则不指定此参数。
- bfile
参考数据面板文件(LD 文件)的路径前缀,用于计算局部遗传相关性。默认值为
"./bfiles/eur_chr@_SNPmaf5"
。- partition
分区文件路径前缀,定义局部遗传相关性的区域。默认值为
"./partition/eur_chr@.bed"
。- save_name
输出结果文件的名称(不包含后缀)。默认值为
"res"
。- save_path
结果文件的保存路径。默认值为
"./supergnova"
。- thread
每条染色体运算的线程数,设置为NULL时,则启用所有线程。
Value
分析结果,包含以下列:
chr: 染色体编号。
start: 该基因组区域的起始位置(来源于输入的基因组分区文件)。
end: 该基因组区域的终止位置(来源于输入的基因组分区文件)。
rho: 估计的局部遗传协方差(local genetic covariance)。
corr: 估计的局部遗传相关性(local genetic correlation)。
h2_1: 采用矩估计法(method of moments)计算的第一个性状的局部遗传力估计值(local heritability)。
h2_2: 采用矩估计法计算的第二个性状的局部遗传力估计值。
var: 局部遗传协方差估计值的方差。
p: 局部遗传协方差的 p 值。
m: 用于计算该基因组区域局部遗传协方差的 SNP 数目。
注意:某些表型的某些基因组区域的真实遗传力可能非常小。尽管已有方法可用于估计局部遗传力,但在许多情况下,这些方法可能会提供不稳定的估计,甚至得到负的遗传力估计值。 SUPERGNOVA 采用如下策略处理负的遗传力估计值:
直接忽略负的遗传力估计值,将相关性估计结果设为 "NA"。
因此,我们建议在局部遗传相关性分析中,优先关注遗传协方差 rho,而非遗传相关性 corr。
Details
该分析基于 SUPERGNOVA 方法,利用 GWAS 数据计算局部遗传相关性和协方差,以探讨两个性状在基因组特定区域上的遗传关联性。
输入数据:
bfile
: 指定.bed/.bim/.fam
格式的基因型数据文件前缀。@
代表通配符字符,SUPERGNOVA 会自动替换为1-22
以涵盖所有常染色体。例如,若有全基因组基因型数据,可指定
bfile = "eur_chr@_SNPmaf5"
。
partition
: 指定基因组分区文件(.bed
格式),用于定义分析区域。@
代表通配符,SUPERGNOVA 会自动替换1-22
。若仅对特定区域感兴趣,可指定一个包含所有目标区域的
.bed
文件,例如eur_chr1.bed
。