Skip to contents

该函数利用SMR软件进行遗传因素与表型特征的相关性分析。通过检测给定基因与GWAS信号之间的关联性,并输出相应的分析结果。

Usage

SMR_multi_HEIDI(
  GWAS_file = " ",
  GWAS_name = " ",
  xQTL_file = " ",
  bfile_1000G = "./1.data/1000G/EUR",
  Gene_name = NULL,
  save_path = "./",
  diff_freq = 0.2,
  diff_freq_prop = 0.05,
  MAF = 0.01,
  cis_wind = 2000,
  pval = 5e-08,
  smr_multi = TRUE,
  smr_multi_set_wind = NULL,
  smr_multi_ld_snp = 0.1,
  heidi_mtd = 1,
  HEIDI_test_pval = 0.00157,
  ld_upper = 0.9,
  ld_lower = 0.05,
  nSNPs_min = 3,
  nSNPs_max = 20,
  thread_num = 4
)

Arguments

GWAS_file

字符串,GWAS数据文件路径,要求为.ma格式。

GWAS_name

字符串,GWAS数据的名称。

xQTL_file

字符串,xQTL数据文件路径。

bfile_1000G

字符串,千人基因组参考面板数据文件的前缀路径(例如:./1.data/1000G/EUR)。

Gene_name

字符串,待分析的基因名称;默认为NULL时分析所有基因。

save_path

字符串,结果保存路径,默认为"./"

diff_freq

数值,等位基因频率差异阈值,用于质量控制。默认为0.2。

diff_freq_prop

数值,SMR分析中允许具有等位基因频率差异的最大SNP比例。默认为0.05。

MAF

数值,次要等位基因频率(MAF)阈值,用于过滤SNP。默认值为0.01,范围为0-0.5。

cis_wind

数值,SMR分析中定义的以探针为中心的染色体区域范围,用于选择cis-eQTL。默认为2000Kb。

pval

数值,SMR分析中使用的top显著相关QTL(如eQTL)的P值阈值,默认为5.0e-8。

smr_multi

逻辑值,是否进行基于多个SNP的SMR分析,默认为TRUE。若为FALSE,则使用top SNP进行SMR分析。

smr_multi_set_wind

数值或字符串,指定基于多个SNP进行SMR分析的基因区域,默认为NULL,表示选择所有SNP。

smr_multi_ld_snp

数值,SMR分析中排除与QTL存在显著连锁不平衡的SNP的LD阈值,默认为0.1。

heidi_mtd

数值,HEIDI检验方法选择。0表示原始HEIDI检验,1表示改进版HEIDI检验,默认为1。

HEIDI_test_pval

数值,HEIDI检验中的QTL P值阈值,默认为1.57e-3。

ld_upper

数值,HEIDI检验中排除与top SNP存在显著连锁不平衡的QTL的LD上限,默认为0.9。

ld_lower

数值,HEIDI检验中排除与top SNP不存在或仅有微弱连锁不平衡的QTL的LD下限,默认为0.05。

nSNPs_min

数值,HEIDI检验中顺式SNP数量的最小阈值,默认为3。

nSNPs_max

数值,HEIDI检验中顺式SNP数量的最大阈值,默认为20。

thread_num

整数,指定并行计算使用的线程数,默认为4。

Value

返回一个 数据框(data frame),包含 SMR(Summary-based Mendelian Randomization)HEIDI(Heterogeneity in Dependent Instruments) 分析结果。 主要包括以下列:

  • probe_ID: 探针 ID(对应目标基因)。

  • probe_chr: 探针所在的染色体编号。

  • gene_name: 目标基因名称。

  • probe_position: 探针的基因组位置(bp)。

  • trans_eQTL_chr: 跨染色体 eQTL 的染色体编号(仅适用于 trans-eQTL 分析)。

  • trans_region_start: trans-eQTL 区域的起始位置(bp)。

  • trans_region_end: trans-eQTL 区域的终止位置(bp)。

  • SNP_name: 关联 SNP(rsID)。

  • SNP_chr: SNP 所在染色体编号。

  • SNP_position: SNP 在基因组上的位置(bp)。

  • effect_allele: 作用等位基因(Coded Allele)。

  • other_allele: 另一等位基因(Reference Allele)。

  • effect_allele_freq: 作用等位基因的频率(基于参考样本估计)。

  • GWAS_beta: GWAS 研究中该 SNP 的效应大小(Beta)。

  • GWAS_SE: GWAS 研究中 Beta 的标准误(Standard Error)。

  • GWAS_p: GWAS 研究中该 SNP 的 P 值。

  • eQTL_beta: eQTL 研究中该 SNP 的效应大小(Beta)。

  • eQTL_SE: eQTL 研究中 Beta 的标准误。

  • eQTL_p: eQTL 研究中该 SNP 的 P 值。

  • SMR_beta: SMR 分析 计算得到的因果效应大小(Beta)。

  • SMR_SE: SMR 分析 计算得到的 Beta 标准误。

  • SMR_p: SMR 分析 计算得到的 P 值。

  • HEIDI_p: HEIDI 检验 计算得到的 P 值(用于检测 SNP 是否可能存在多效性)。

  • HEIDI_nSNP: HEIDI 检验 中使用的 SNP 数量。