机器学习工具包PRoNTo入门操作指南

2018-7-12 15:38| 发布者: admin| 查看: 71| 评论: 0

摘要: 近年来,随着机器学习、深度学习和大数据计算等领域的飞速发展,越来越多的神经影像学问题有望在与人工智能(AI)结合的方法中得到新的发现与突破。然而,两个领域的广泛合作受限于机器学习模型对数学基础及编程能力 ...

近年来,随着机器学习、深度学习和大数据计算等领域的飞速发展,越来越多的神经影像学问题有望在与人工智能(AI)结合的方法中得到新的发现与突破。然而,两个领域的广泛合作受限于机器学习模型对数学基础及编程能力的较高要求(具体综述请参考《基于脑影像的机器学习工具包PRoNTo介绍》)。PRoNTo是一款基于Matlab、SPM函数库、和libsvm函数库的机器学习工具包,它具有友好的图形交互界面、较全面的机器学习算法覆盖、以及完善的结果呈现模块。本文试图对PRoNTo在fMRI数据上的应用进行初步的概括,以期初学者在阅读后可以快速入门, PRoNTo的作者之一Christophe Philips教授即将在七月来深圳授课,想与他深入交流的读者请查看UCL神经影像中心SPM暑期课程具体课程信息。

1. 数据准备

首先,PRoNTo接受常用的NIFTI格式数据, 与FSL、SPM预处理后的数据可以无障碍对接, 静息态、任务态功能、以及结构数据均可用于机器学习模型的输入,但需所有数据已提前完成预处理并已配准到统一模版。ProNTo只接受volume数据。

2. 安装及启动PRoNTo

PRoNTo要求Matlab R2014a及以前版本, SPM8或SPM12已提前安装,并且libsvm已在Matlab中成功编译,libsvm安装及编译请参考 https://www.csie.ntu.edu.tw/~cjlin/libsvm/ 。PRoNTo在 http://www.mlnl.cs.ucl.ac.uk/pronto/prtsoftware.html 注册后即可下载。下载后在Matlab菜单里点击“Set Path” -> “Add folder” PRoNTo文件夹后即安装完成。在Matlab命令窗口输入“prt”或“pronto”可启动图形界面(如下图)。

- PRoNTo主要功能界面(图片来自PRoNTo用户手册)

3. 载入数据(Data & Design)

打开主界面后,点击“Data & Design” 按钮可以打开数据载入界面, 如下图所示。首先点击最上方的“Browse”选择输出位置(所以PRoNTo的生成文件将自动保存于此位置)。数据输入结构按“groups” -> “Subjects/Scans”-> “Modalities/runs”展开,点击“Add”或“Remove”即可添加或删除组别,如果勾选“Scans”可跳过Subjects(对于每个被试只有一个图像的情况,一般点Scans),并在Modalities/runs里选择数据所在的位置并载入。点击“Review”会弹出数据的基本情况,点击“save”,输出文件夹里将出现“prt.mat”文件以存储数据相关信息并用于后续的计算。

- PRoNTo数据输入界面(图片来自PRoNTo用户手册)

4. 特征准备(Prepare feature set)

重回主界面,点击“Prepare feature set”,可弹出“特征准备”界面如下图。点击最上方的“...”选择上一步中生成的“prt.mat”文件,选择后其他区域将被自动填充。然后点击“Build kernal/data matrix”,此处定义的feature set将被自动写入“prt.mat”文件。

PRoNTo特征准备界面(图片来自PRoNTo用户手册)

5. 选择模型(Specify Model)及模型计算 (Run Model)

在主菜单中点击“Specify model” 可弹出模型定义界面,如下图所示。在载入前序步骤生成的“prt.mat”文件后,feature set的下拉菜单会自动生成,用户可选择已定的feature set进行后续分析。根据需解决的问题,model type可在“classification”或“Regression”之间选择。除此以外,该界面还可以定义是否需要用交叉验证(cross-validation)的方法优化超参(Optimize hyper-parameter)、整个数据集的交叉验证方法(Cross-Validation Scheme),及是否需要对数据做归一化处理(Data operations)等。设置完成后,可直接点击“Specify and run model”进行模型计算。

- PRoNTo模型定义界面(图片来自PRoNTo用户手册)

5.1 分类问题

如果在Model Type选择了“Classifiction”,将进入到下图界面。用户可首先定义有几类,并在上层界面选择“成对的二分类”还是“多分类”。在该界面中可根据 不同的class定义数据组别据类别名称。

- PRoNTo分类模型定义界面(图片来自PRoNTo用户手册)

5.2 回归问题

如果在Model Type选择了“Regression”,将进入到下图界面。回归问题的目标变量为连续变量,需在Design的步骤中输入。

- PRoNTo回归模型定义界面(图片来自PRoNTo用户手册)

6. 结果呈现 (Display results and Display weights)

PRoNTo提供了比较完善的结果呈现方法,包括常用的混淆矩阵(confusion matrix),ROC曲线,置换检验(permutation test),数据分布图、以及影像学专家关心的不同脑区在预测中的贡献权重(weights)等。点击主界面中的“Display results”和“Display weights”即可进入到相关功能界面。下图展示了几个结果呈现事例。

- PRoNTo结果呈现示例(图片来自PRoNTo用户手册)

PRoNTo权重呈现示例(图片来自PRoNTo用户手册)


鲜花

握手

雷人

路过

鸡蛋

相关阅读

发表评论

最新评论

Archiver|手机版|小黑屋|谭兴才自媒体

GMT+8, 2018-8-20 15:54 , Processed in 0.161917 second(s), 25 queries .

谭兴才 ©版权所有

© 2018 TanXingCai.com

返回顶部