使用 Python 实现 chrpos 转 rsid — tran_SNP

此函数用于根据给定的 GWAS 数据文件和 dbSNP 数据库，进行染色体位置到 rsid 的转换。支持基因组版本 37（hg19）和 38（hg38）。请确保已安装 Miniconda 和相关 Python 包。

Usage

tran_SNP_python(
  GWAS_file = "XXX.txt",
  dbsnp_file = "./GCF_000001405.25.gz",
  build = 37,
  chr_col = "CHR",
  pos_col = "BP",
  effect_allele_col = "effect_allele",
  other_allele_col = "other_allele",
  keep_snp = FALSE,
  exact_map = FALSE,
  save_name = "GetSNP",
  save_path = "./tran"
)

Arguments

GWAS_file: 字符串，GWAS 数据文件路径。
dbsnp_file: 字符串，dbSNP 数据库文件路径。支持 GCF_000001405.25.gz（hg19）和 GCF_000001405.40.gz（hg38）。
build: 数字，GWAS 数据的基因组版本，37 或 38。默认值为 37，表示使用 GCF_000001405.25.gz（hg19）。
chr_col: 字符串，数据中包含染色体信息的列名。
pos_col: 字符串，数据中包含 SNP 位置（即基因组上的 BP 位点）的列名。
effect_allele_col: 字符串，数据中包含效应等位基因的列名。
other_allele_col: 字符串，数据中包含非效应等位基因的列名。
keep_snp: 布尔值，默认值为 FALSE。若为 TRUE，则将未匹配成功的 rsid 以 'CHR:POS:REF:ALT' 形式保留在 SNP 列。
exact_map: 布尔值，默认值为 FALSE，仅根据 chr 与 pos 进行匹配。若为 TRUE，则同时根据 effect_allele 与 other_allele 精确匹配。
save_name: 字符串，输出结果文件的名称。
save_path: 字符串，输出结果文件的保存路径。

Value

无返回值，结果将保存在指定路径的文件中。