使用PoPS进行基因优先评分分析
PoPS_py_run.Rd
该函数用于调用 PoPS (Polygenic Score) 算法,进行基因优先评分分析。官网:https://github.com/FinucaneLab/pops PoPS 是一种用于多基因遗传评分(Polygenic Risk Score,PRS)的工具,它能够结合基因表达数据和基因级别的统计结果,生成更为精确的多基因评分模型。
Usage
PoPS_py_run(
test_help = FALSE,
gene_annot_path = "./data/utils/gene_annot_jun10.txt",
feature_mat_prefix = "./data/features_munged/pops_features",
num_feature_chunks = 2,
magma_prefix = "./data/magma_scores/PASS_Schizophrenia",
control_features_path = "./data/utils/features_jul17_control.txt",
opt_arguments = NULL,
save_name = "PASS_Schizophrenia",
save_path = "./out"
)
Arguments
- test_help
逻辑值。如果设置为 TRUE,则仅输出帮助信息而不执行实际分析。用于检查 PoPS 算法的命令行选项和参数。
- gene_annot_path
基因注释文件的路径。文件应为制表符分隔的文本文件,并包含以下列:
ENSGID
(Ensembl基因ID)CHR
(染色体编号)TSS
(转录起始位点) 该文件用于提供基因的基本信息,PoPS 会使用它来关联基因表达数据。- feature_mat_prefix
特征矩阵文件的前缀路径。通常由
munge_feature_directory.py
脚本处理后的特征矩阵文件。这些文件应包括:.mat.npy
文件:包含基因特征数据。.cols.txt
文件:包含特征(即基因)对应的列名信息。.rows.txt
文件:包含与特征矩阵相关的样本信息。 PoPS 使用这些特征矩阵数据进行基因优先评分(PoPS)分析。- num_feature_chunks
特征矩阵分块的数量。默认值为 2。PoPS 会将特征矩阵划分为多个块,以提高内存和计算效率。该参数用于设置分块的数量。
- control_features_path
可选参数,控制特征的路径。该文件应包含每行一个特征,用于在分析中强制包含的特征列表,通常用于控制变量或预定义的基因集。
- opt_arguments
额外的命令行参数,可以根据需要添加更多 PoPS 算法的自定义参数。
- save_name
结果文件的前缀名称,PoPS 将根据该名称保存输出文件。
- save_path
结果文件的保存路径,PoPS 输出的文件将保存在该路径下。