Skip to contents

该函数用于调用 PoPS (Polygenic Score) 算法,进行基因优先评分分析。官网:https://github.com/FinucaneLab/pops PoPS 是一种用于多基因遗传评分(Polygenic Risk Score,PRS)的工具,它能够结合基因表达数据和基因级别的统计结果,生成更为精确的多基因评分模型。

Usage

PoPS_py_run(
  test_help = FALSE,
  gene_annot_path = "./data/utils/gene_annot_jun10.txt",
  feature_mat_prefix = "./data/features_munged/pops_features",
  num_feature_chunks = 2,
  magma_prefix = "./data/magma_scores/PASS_Schizophrenia",
  control_features_path = "./data/utils/features_jul17_control.txt",
  opt_arguments = NULL,
  save_name = "PASS_Schizophrenia",
  save_path = "./out"
)

Arguments

test_help

逻辑值。如果设置为 TRUE,则仅输出帮助信息而不执行实际分析。用于检查 PoPS 算法的命令行选项和参数。

gene_annot_path

基因注释文件的路径。文件应为制表符分隔的文本文件,并包含以下列: ENSGID(Ensembl基因ID) CHR(染色体编号) TSS(转录起始位点) 该文件用于提供基因的基本信息,PoPS 会使用它来关联基因表达数据。

feature_mat_prefix

特征矩阵文件的前缀路径。通常由 munge_feature_directory.py 脚本处理后的特征矩阵文件。这些文件应包括: .mat.npy 文件:包含基因特征数据。 .cols.txt 文件:包含特征(即基因)对应的列名信息。 .rows.txt 文件:包含与特征矩阵相关的样本信息。 PoPS 使用这些特征矩阵数据进行基因优先评分(PoPS)分析。

num_feature_chunks

特征矩阵分块的数量。默认值为 2。PoPS 会将特征矩阵划分为多个块,以提高内存和计算效率。该参数用于设置分块的数量。

control_features_path

可选参数,控制特征的路径。该文件应包含每行一个特征,用于在分析中强制包含的特征列表,通常用于控制变量或预定义的基因集。

opt_arguments

额外的命令行参数,可以根据需要添加更多 PoPS 算法的自定义参数。

save_name

结果文件的前缀名称,PoPS 将根据该名称保存输出文件。

save_path

结果文件的保存路径,PoPS 输出的文件将保存在该路径下。

Value

返回一个包含 PoPS 分析的预测结果