我正在对 MRI 数据进行 Matlab 分析,其中我在大小为 10304x236 的矩阵上执行了 PCA,其中 10304 是体素的数量(将它们视为像素),236 是时间点的数量。PCA 给了我 236 个特征值及其相关系数。这一切都很好。但是,当需要决定要保留多少组件时,我正在复制的论文说如下(如果需要任何澄清,请告诉我,因为这只是整篇论文的一小部分):
然后,我们进行了蒙特卡罗模拟,以确定要从每次扫描的有害 ROI 数据中提取的主成分 (PC) 的数量。通过对与编码和休息滋扰 ROI 数据具有相同等级的正态分布数据执行 PCA,分别为每个受试者的编码和休息数据生成预期特征值的空分布。如果它们的相关特征值超过蒙特卡洛模拟的特征值的第 99 个置信区间,则来自真正令人讨厌的 ROI 数据的 PC 被选择用于给定的休息或编码扫描。
我完全不知道在这里做什么。我习惯于根据解释的累积方差来选择组件。不过我的想法是这样的:
然后,我们进行了蒙特卡罗模拟,以确定要从每次扫描的有害 ROI 数据中提取的主成分 (PC) 的数量。
蒙特卡洛模拟人生只是意味着做以下 1000 次(或类似)次,对吧?
通过对与编码和剩余有害 ROI 数据具有相同等级的正态分布数据执行 PCA,可以生成预期特征值的零分布。
首先,我假设“等秩”基本上意味着我将创建一个与原始矩阵 (10304x236) 大小相同的矩阵。就“等秩的正态分布数据”而言……这是否意味着我应该从正态分布中创建一个 10304x236 的随机数矩阵?Matlab 有一个名为“normrnd”的函数可以执行此操作,但需要一个 mu 和 sigma 输入。我会使用与从初始数据集派生的相同的 mu 和 sigma 吗?这或多或少是“预期特征值”的意思,因为我不知道预期特征值的分布是什么样的。
我想我的问题或多或少是我不知道如何制作特征值的“零分布”。