基于SMR软件的孟德尔随机化分析
SMR_multi_HEIDI.Rd
该函数利用SMR软件进行遗传因素与表型特征的相关性分析。通过检测给定基因与GWAS信号之间的关联性,并输出相应的分析结果。
Usage
SMR_multi_HEIDI(
GWAS_file = " ",
GWAS_name = " ",
xQTL_file = " ",
bfile_1000G = "./1.data/1000G/EUR",
Gene_name = NULL,
save_path = "./",
diff_freq = 0.2,
diff_freq_prop = 0.05,
MAF = 0.01,
cis_wind = 2000,
pval = 5e-08,
smr_multi = TRUE,
smr_multi_set_wind = NULL,
smr_multi_ld_snp = 0.1,
heidi_mtd = 1,
HEIDI_test_pval = 0.00157,
ld_upper = 0.9,
ld_lower = 0.05,
nSNPs_min = 3,
nSNPs_max = 20,
thread_num = 4
)
Arguments
- GWAS_file
字符串,GWAS数据文件路径,要求为
.ma
格式。- GWAS_name
字符串,GWAS数据的名称。
- xQTL_file
字符串,xQTL数据文件路径。
- bfile_1000G
字符串,千人基因组参考面板数据文件的前缀路径(例如:
./1.data/1000G/EUR
)。- Gene_name
字符串,待分析的基因名称;默认为NULL时分析所有基因。
- save_path
字符串,结果保存路径,默认为
"./"
。- diff_freq
数值,等位基因频率差异阈值,用于质量控制。默认为0.2。
- diff_freq_prop
数值,SMR分析中允许具有等位基因频率差异的最大SNP比例。默认为0.05。
- MAF
数值,次要等位基因频率(MAF)阈值,用于过滤SNP。默认值为0.01,范围为0-0.5。
- cis_wind
数值,SMR分析中定义的以探针为中心的染色体区域范围,用于选择cis-eQTL。默认为2000Kb。
- pval
数值,SMR分析中使用的top显著相关QTL(如eQTL)的P值阈值,默认为5.0e-8。
- smr_multi
逻辑值,是否进行基于多个SNP的SMR分析,默认为
TRUE
。若为FALSE
,则使用top SNP进行SMR分析。- smr_multi_set_wind
数值或字符串,指定基于多个SNP进行SMR分析的基因区域,默认为
NULL
,表示选择所有SNP。- smr_multi_ld_snp
数值,SMR分析中排除与QTL存在显著连锁不平衡的SNP的LD阈值,默认为0.1。
- heidi_mtd
数值,HEIDI检验方法选择。0表示原始HEIDI检验,1表示改进版HEIDI检验,默认为1。
- HEIDI_test_pval
数值,HEIDI检验中的QTL P值阈值,默认为1.57e-3。
- ld_upper
数值,HEIDI检验中排除与top SNP存在显著连锁不平衡的QTL的LD上限,默认为0.9。
- ld_lower
数值,HEIDI检验中排除与top SNP不存在或仅有微弱连锁不平衡的QTL的LD下限,默认为0.05。
- nSNPs_min
数值,HEIDI检验中顺式SNP数量的最小阈值,默认为3。
- nSNPs_max
数值,HEIDI检验中顺式SNP数量的最大阈值,默认为20。
- thread_num
整数,指定并行计算使用的线程数,默认为4。
Value
返回一个 数据框(data frame),包含 SMR(Summary-based Mendelian Randomization) 和 HEIDI(Heterogeneity in Dependent Instruments) 分析结果。 主要包括以下列:
probe_ID: 探针 ID(对应目标基因)。
probe_chr: 探针所在的染色体编号。
gene_name: 目标基因名称。
probe_position: 探针的基因组位置(bp)。
trans_eQTL_chr: 跨染色体 eQTL 的染色体编号(仅适用于 trans-eQTL 分析)。
trans_region_start: trans-eQTL 区域的起始位置(bp)。
trans_region_end: trans-eQTL 区域的终止位置(bp)。
SNP_name: 关联 SNP(rsID)。
SNP_chr: SNP 所在染色体编号。
SNP_position: SNP 在基因组上的位置(bp)。
effect_allele: 作用等位基因(Coded Allele)。
other_allele: 另一等位基因(Reference Allele)。
effect_allele_freq: 作用等位基因的频率(基于参考样本估计)。
GWAS_beta: GWAS 研究中该 SNP 的效应大小(Beta)。
GWAS_SE: GWAS 研究中 Beta 的标准误(Standard Error)。
GWAS_p: GWAS 研究中该 SNP 的 P 值。
eQTL_beta: eQTL 研究中该 SNP 的效应大小(Beta)。
eQTL_SE: eQTL 研究中 Beta 的标准误。
eQTL_p: eQTL 研究中该 SNP 的 P 值。
SMR_beta: SMR 分析 计算得到的因果效应大小(Beta)。
SMR_SE: SMR 分析 计算得到的 Beta 标准误。
SMR_p: SMR 分析 计算得到的 P 值。
HEIDI_p: HEIDI 检验 计算得到的 P 值(用于检测 SNP 是否可能存在多效性)。
HEIDI_nSNP: HEIDI 检验 中使用的 SNP 数量。