使用 Python 实现 chrpos 转 rsid
tran_SNP_python.Rd
此函数用于根据给定的 GWAS 数据文件和 dbSNP 数据库,进行染色体位置到 rsid 的转换。支持基因组版本 37(hg19)和 38(hg38)。请确保已安装 Miniconda 和相关 Python 包。
Usage
tran_SNP_python(
GWAS_file = "XXX.txt",
dbsnp_file = "./GCF_000001405.25.gz",
build = 37,
chr_col = "CHR",
pos_col = "BP",
effect_allele_col = "effect_allele",
other_allele_col = "other_allele",
keep_snp = FALSE,
exact_map = FALSE,
save_name = "GetSNP",
save_path = "./tran"
)
Arguments
- GWAS_file
字符串,GWAS 数据文件路径。
- dbsnp_file
字符串,dbSNP 数据库文件路径。支持 GCF_000001405.25.gz(hg19)和 GCF_000001405.40.gz(hg38)。
- build
数字,GWAS 数据的基因组版本,37 或 38。默认值为 37,表示使用 GCF_000001405.25.gz(hg19)。
- chr_col
字符串,数据中包含染色体信息的列名。
- pos_col
字符串,数据中包含 SNP 位置(即基因组上的 BP 位点)的列名。
- effect_allele_col
字符串,数据中包含效应等位基因的列名。
- other_allele_col
字符串,数据中包含非效应等位基因的列名。
- keep_snp
布尔值,默认值为
FALSE
。若为TRUE
,则将未匹配成功的 rsid 以 'CHR:POS:REF:ALT' 形式保留在 SNP 列。- exact_map
布尔值,默认值为
FALSE
,仅根据 chr 与 pos 进行匹配。若为TRUE
,则同时根据 effect_allele 与 other_allele 精确匹配。- save_name
字符串,输出结果文件的名称。
- save_path
字符串,输出结果文件的保存路径。