PoPS分析 — PoPS_run • QTLMR

该函数用于调用 PoPS (Polygenic Score) 算法，进行基因优先评分分析。官网：https://github.com/FinucaneLab/pops PoPS 是一种用于多基因遗传评分（Polygenic Risk Score，PRS）的工具，它能够结合基因表达数据和基因级别的统计结果，生成更为精确的多基因评分模型。

Usage

PoPS_run(
  test_help = FALSE,
  GWAS_file = "./ULCER_METAL_FinnGen.txt",
  bfile = "./data/bfile/1000G.EUR",
  gene_annot = "./data/magma_0kb.genes.annot",
  SNP_P_col = c(3, 10),
  samplesize_col = "N",
  gene_annot_path = "./data/utils/gene_annot_jun10.txt",
  feature_mat_prefix = "./data/features_munged/pops_features",
  num_feature_chunks = 12,
  control_features_path = "./data/utils/features_jul17_control.txt",
  opt_arguments = NULL,
  save_name = "UC",
  save_path = "./out"
)

Arguments

test_help: 逻辑值。如果设置为 TRUE，则仅输出帮助信息而不执行实际分析。用于检查 PoPS 算法的命令行选项和参数。
GWAS_file: GWAS的文件路径。
bfile: 生成MAGMA分数所需的1000G基因型数据文件路径，下载地址：https://www.dropbox.com/sh/o6t5jprvxb8b500/AABDwtPv9s5Do97oPpnUNueia?dl=0。
gene_annot: 生成MAGMA分数所需的基因的注释文件路径，下载地址：https://www.dropbox.com/sh/o6t5jprvxb8b500/AABDwtPv9s5Do97oPpnUNueia?dl=0。
SNP_P_col: GWAS数据中SNP和P值所在列位置，向量格式如：c(3,10)。
samplesize_col: GWAS数据中样本量的列名，或直接赋值样本量数量。
gene_annot_path: 基因注释文件的路径。文件应为制表符分隔的文本文件，并包含以下列： ENSGID（Ensembl基因ID） CHR（染色体编号） TSS（转录起始位点）该文件用于提供基因的基本信息，PoPS 会使用它来关联基因表达数据。
feature_mat_prefix: 特征矩阵文件的前缀路径。通常由 munge_feature_directory.py 脚本处理后的特征矩阵文件。这些文件应包括： .mat.npy 文件：包含基因特征数据。 .cols.txt 文件：包含特征（即基因）对应的列名信息。 .rows.txt 文件：包含与特征矩阵相关的样本信息。 PoPS 使用这些特征矩阵数据进行基因优先评分（PoPS）分析。
num_feature_chunks: 特征矩阵分块的数量。默认值为 2。PoPS 会将特征矩阵划分为多个块，以提高内存和计算效率。该参数用于设置分块的数量。
control_features_path: 可选参数，控制特征的路径。该文件应包含每行一个特征，用于在分析中强制包含的特征列表，通常用于控制变量或预定义的基因集。
opt_arguments: 额外的命令行参数，可以根据需要添加更多 PoPS 算法的自定义参数。
save_name: 结果文件的前缀名称，PoPS 将根据该名称保存输出文件。
save_path: 结果文件的保存路径，PoPS 输出的文件将保存在该路径下。

Value

返回一个包含 PoPS 分析的预测结果