PoPS分析
PoPS_run.Rd
该函数用于调用 PoPS (Polygenic Score) 算法,进行基因优先评分分析。官网:https://github.com/FinucaneLab/pops PoPS 是一种用于多基因遗传评分(Polygenic Risk Score,PRS)的工具,它能够结合基因表达数据和基因级别的统计结果,生成更为精确的多基因评分模型。
Usage
PoPS_run(
test_help = FALSE,
GWAS_file = "./ULCER_METAL_FinnGen.txt",
bfile = "./data/bfile/1000G.EUR",
gene_annot = "./data/magma_0kb.genes.annot",
SNP_P_col = c(3, 10),
samplesize_col = "N",
gene_annot_path = "./data/utils/gene_annot_jun10.txt",
feature_mat_prefix = "./data/features_munged/pops_features",
num_feature_chunks = 12,
control_features_path = "./data/utils/features_jul17_control.txt",
opt_arguments = NULL,
save_name = "UC",
save_path = "./out"
)
Arguments
- test_help
逻辑值。如果设置为 TRUE,则仅输出帮助信息而不执行实际分析。用于检查 PoPS 算法的命令行选项和参数。
- GWAS_file
GWAS的文件路径。
- bfile
生成MAGMA分数所需的1000G基因型数据文件路径,下载地址:https://www.dropbox.com/sh/o6t5jprvxb8b500/AABDwtPv9s5Do97oPpnUNueia?dl=0。
- gene_annot
生成MAGMA分数所需的基因的注释文件路径,下载地址:https://www.dropbox.com/sh/o6t5jprvxb8b500/AABDwtPv9s5Do97oPpnUNueia?dl=0。
- SNP_P_col
GWAS数据中SNP和P值所在列位置,向量格式如:c(3,10)。
- samplesize_col
GWAS数据中样本量的列名,或直接赋值样本量数量。
- gene_annot_path
基因注释文件的路径。文件应为制表符分隔的文本文件,并包含以下列:
ENSGID
(Ensembl基因ID)CHR
(染色体编号)TSS
(转录起始位点) 该文件用于提供基因的基本信息,PoPS 会使用它来关联基因表达数据。- feature_mat_prefix
特征矩阵文件的前缀路径。通常由
munge_feature_directory.py
脚本处理后的特征矩阵文件。这些文件应包括:.mat.npy
文件:包含基因特征数据。.cols.txt
文件:包含特征(即基因)对应的列名信息。.rows.txt
文件:包含与特征矩阵相关的样本信息。 PoPS 使用这些特征矩阵数据进行基因优先评分(PoPS)分析。- num_feature_chunks
特征矩阵分块的数量。默认值为 2。PoPS 会将特征矩阵划分为多个块,以提高内存和计算效率。该参数用于设置分块的数量。
- control_features_path
可选参数,控制特征的路径。该文件应包含每行一个特征,用于在分析中强制包含的特征列表,通常用于控制变量或预定义的基因集。
- opt_arguments
额外的命令行参数,可以根据需要添加更多 PoPS 算法的自定义参数。
- save_name
结果文件的前缀名称,PoPS 将根据该名称保存输出文件。
- save_path
结果文件的保存路径,PoPS 输出的文件将保存在该路径下。