Skip to contents

该函数用于执行GCTA软件包中的FastBAT分析,基于给定的GWAS数据文件和基因列表文件,进行快速的基因-表型关联分析,详见:https://yanglab.westlake.edu.cn/software/gcta/#fastBAT。

Usage

GCTA_fastBAT(
  GWSAfile = "./Migraine_SMR_FinnGen.ma",
  bfile = "./1.data/1000G/EUR",
  gene_list = "./glist-hg38",
  maf = 0.01,
  cores = 6,
  opt_arguments = NULL,
  save_name = "Migraine",
  save_path = "fastBAT"
)

Arguments

GWSAfile

字符串,指定输入.ma格式的GWAS结果文件路径(如:Migraine_SMR_FinnGen.ma)。

bfile

字符串,进行基因型数据的连锁不平衡(LD)估计时的参考面板文件的前缀路径(如:./1.data/1000G/EUR)。

gene_list

字符串,指定基因列表文件的路径(如:./glist-hg38)。

maf

数值,指定过滤的最小等位基因频率(MAF),默认值为0.01。

cores

数值,指定要使用的CPU线程数量,默认值为2。

opt_arguments

字符串或NULL,额外的命令行参数,用于GCTA的FastBAT分析(默认为NULL)。

save_name

字符串,指定输出结果文件的名称。

save_path

字符串,指定结果文件保存路径。

Value

返回.gene.fbat结果,结果文件包含以下内容:

Gene

基因ID

Chr

染色体编号

Start and End

基因区域的左侧和右侧边界

No.SNPs

基因区域内的SNP数量

SNP_start and SNP_end

基因区域的左侧和右侧边界SNP位置

Chisq(Obs)

基因区域内所有SNP的卡方检验统计量之和

Pvalue

基因水平的检验p值

TopSNP.Pvalue

基因区域内最小的单个SNP GWAS p值

TopSNP

与基因关联的最显著GWAS SNP

Note

该方法利用全基因组关联研究(GWAS)的汇总数据和来自参考样本的个体级基因型数据的连锁不平衡(LD)数据, 执行人类复杂性状的快速集合关联分析。有关该方法的详细信息,请参阅Bakshi等人(2016年,Scientific Reports)的研究,PMID: 27604177。