Skip to contents

该函数用于调用 PoPS (Polygenic Score) 算法,进行基因优先评分分析。官网:https://github.com/FinucaneLab/pops PoPS 是一种用于多基因遗传评分(Polygenic Risk Score,PRS)的工具,它能够结合基因表达数据和基因级别的统计结果,生成更为精确的多基因评分模型。

Usage

PoPS_run(
  test_help = FALSE,
  GWAS_file = "./ULCER_METAL_FinnGen.txt",
  bfile = "./data/bfile/1000G.EUR",
  gene_annot = "./data/magma_0kb.genes.annot",
  SNP_P_col = c(3, 10),
  samplesize_col = "N",
  gene_annot_path = "./data/utils/gene_annot_jun10.txt",
  feature_mat_prefix = "./data/features_munged/pops_features",
  num_feature_chunks = 12,
  control_features_path = "./data/utils/features_jul17_control.txt",
  opt_arguments = NULL,
  save_name = "UC",
  save_path = "./out"
)

Arguments

test_help

逻辑值。如果设置为 TRUE,则仅输出帮助信息而不执行实际分析。用于检查 PoPS 算法的命令行选项和参数。

GWAS_file

GWAS的文件路径。

bfile

生成MAGMA分数所需的1000G基因型数据文件路径,下载地址:https://www.dropbox.com/sh/o6t5jprvxb8b500/AABDwtPv9s5Do97oPpnUNueia?dl=0。

gene_annot

生成MAGMA分数所需的基因的注释文件路径,下载地址:https://www.dropbox.com/sh/o6t5jprvxb8b500/AABDwtPv9s5Do97oPpnUNueia?dl=0。

SNP_P_col

GWAS数据中SNP和P值所在列位置,向量格式如:c(3,10)。

samplesize_col

GWAS数据中样本量的列名,或直接赋值样本量数量。

gene_annot_path

基因注释文件的路径。文件应为制表符分隔的文本文件,并包含以下列: ENSGID(Ensembl基因ID) CHR(染色体编号) TSS(转录起始位点) 该文件用于提供基因的基本信息,PoPS 会使用它来关联基因表达数据。

feature_mat_prefix

特征矩阵文件的前缀路径。通常由 munge_feature_directory.py 脚本处理后的特征矩阵文件。这些文件应包括: .mat.npy 文件:包含基因特征数据。 .cols.txt 文件:包含特征(即基因)对应的列名信息。 .rows.txt 文件:包含与特征矩阵相关的样本信息。 PoPS 使用这些特征矩阵数据进行基因优先评分(PoPS)分析。

num_feature_chunks

特征矩阵分块的数量。默认值为 2。PoPS 会将特征矩阵划分为多个块,以提高内存和计算效率。该参数用于设置分块的数量。

control_features_path

可选参数,控制特征的路径。该文件应包含每行一个特征,用于在分析中强制包含的特征列表,通常用于控制变量或预定义的基因集。

opt_arguments

额外的命令行参数,可以根据需要添加更多 PoPS 算法的自定义参数。

save_name

结果文件的前缀名称,PoPS 将根据该名称保存输出文件。

save_path

结果文件的保存路径,PoPS 输出的文件将保存在该路径下。

Value

返回一个包含 PoPS 分析的预测结果