NMF算法
NMF(Non-negative matrix factorization, 非负矩阵分解)
NMF算法类似于主成分分析,是一种降维算法。其可将原始的非负矩阵分解为两个非负矩阵的乘积,从而对原始数据进行降维。
数学语言表示为:对于给定非负矩阵V,可寻找到,两个非负矩阵W和H,使得 V ≈ W ✖ H
(原始图床网站不稳定,需要更换图床)
其中,
V矩阵中每一列表示一个观测(observation)或者为一个样本,每一行表示一个特征(feature);
W矩阵为基矩阵,代表每个特征对聚类结果的贡献度;
H矩阵称为系数矩阵或样本矩阵,代表每个样本对聚类结果的贡献度;
NMF算法采用欧几里得距离的平方来衡量X与UV^T^
# cNMF算法(约束非负矩阵分解) 改算法在NMF算法的基础上,将标签信息作为附加的硬性约束,使得具有相同类标签信息的数据在新的低维空间保持一致。但是对于没有标签的数据样本没有任何的约束能力。 cNMF算法是假设数据集**X**中包含有c类样本,其中前l个样本点x~1~,x ~2~ ,…,x~l~ 标签信息已知,其余n-l个样本标签信息位置。 cNMF算法引入辅助矩阵**Z**将上述样本约束矩阵嵌入目标函数中,使得**V**中属于同一类的样本映射为同一点,令**V** = **A** **Z**,即最小化一下目标函数。部分代码实现原则
偏差计算
1 |
|
All articles in this blog are licensed under CC BY-NC-SA 4.0 unless stating additionally.