Skip to contents

此函数用于根据给定的 GWAS 数据文件和 dbSNP 数据库,进行染色体位置到 rsid 的转换。支持基因组版本 37(hg19)和 38(hg38)。请确保已安装 Miniconda 和相关 Python 包。

Usage

tran_SNP_python(
  GWAS_file = "XXX.txt",
  dbsnp_file = "./GCF_000001405.25.gz",
  build = 37,
  chr_col = "CHR",
  pos_col = "BP",
  effect_allele_col = "effect_allele",
  other_allele_col = "other_allele",
  keep_snp = FALSE,
  exact_map = FALSE,
  save_name = "GetSNP",
  save_path = "./tran"
)

Arguments

GWAS_file

字符串,GWAS 数据文件路径。

dbsnp_file

字符串,dbSNP 数据库文件路径。支持 GCF_000001405.25.gz(hg19)和 GCF_000001405.40.gz(hg38)。

build

数字,GWAS 数据的基因组版本,37 或 38。默认值为 37,表示使用 GCF_000001405.25.gz(hg19)。

chr_col

字符串,数据中包含染色体信息的列名。

pos_col

字符串,数据中包含 SNP 位置(即基因组上的 BP 位点)的列名。

effect_allele_col

字符串,数据中包含效应等位基因的列名。

other_allele_col

字符串,数据中包含非效应等位基因的列名。

keep_snp

布尔值,默认值为 FALSE。若为 TRUE,则将未匹配成功的 rsid 以 'CHR:POS:REF:ALT' 形式保留在 SNP 列。

exact_map

布尔值,默认值为 FALSE,仅根据 chr 与 pos 进行匹配。若为 TRUE,则同时根据 effect_allele 与 other_allele 精确匹配。

save_name

字符串,输出结果文件的名称。

save_path

字符串,输出结果文件的保存路径。

Value

无返回值,结果将保存在指定路径的文件中。