当前位置: 首页 > news >正文

【Python】scipy稀疏矩阵的奇异值分解svds

文章目录

    • 基本原理
    • scipy实现
    • 测试

基本原理

AAA是方阵时,可以很容易地进行特征分解:A=WΣW−1A=W\Sigma W^{-1}A=WΣW1,其中Σ\SigmaΣAAA的特征值组成的对角矩阵。如果WWW由标准正交基组成,则W−1=WTW^{-1}=W^TW1=WT,特征分解可进一步写成WTΣWW^T\Sigma WWTΣW

然而,当AAA不是方阵时,情况大不一样了,但仍然可以将AAA表示成A=UΣVTA=U\Sigma V^TA=UΣVT的形式,其中Σ\SigmaΣ也是对角矩阵,对角线上的每个元素被称作奇异值。

奇异值的求解过程和特征值息息相关,因为把AAA变成方阵很简单,只要乘以转置就行。故令L=AATL=AA^TL=AATR=ATAR=A^TAR=ATA,则L,RL, RL,R都可以求特征值λi\lambda_iλi和特征向量,其中LLL的特征向量为AAA的左奇异向量,RRR的特征向量为右奇异向量。对应的奇异值σi=λi\sigma_i=\sqrt{\lambda_i}σi=λi

scipy实现

scipy.sparse.linalg中实现了稀疏矩阵奇异值分解算法,其参数列表如下

svds(A, k=6, ncv=None, tol=0, which='LM', v0=None, maxiter=None, return_singular_vectors=True, solver='arpack', random_state=None, options=None)

各参数含义如下

  • A 待分解矩阵
  • k 奇异值个数,必须在[k,kmax⁡][k, k_{\max}][k,kmax]之间, 当solver='propack'时,kmax=min⁡(M,N)k_{max}=\min(M,N)kmax=min(M,N),否则kmax=min⁡(M,N)−1k_{max}=\min(M,N)-1kmax=min(M,N)1
  • ncv solver='arpack'时,此为Lanczos向量个数,否则此项忽略。
  • tol 奇异值容忍度,为0表示达到机器的精度
  • which'LM'时,选取最大的奇异值;'SM'则选取最小奇异值
  • v0 迭代初值
  • maxiter 迭代次数
  • return_singular_vectors 可选4个值
    • True 返回奇异向量
    • False 不返回奇异向量
    • "u": 如果M <= N,只计算左奇异向量
    • "vh": 如果M > N,只计算右奇异向量;如果 solver='propack',这个选项将忽略矩阵维度
  • solver 可选'arpack', 'propack', 'lobpcg',但比较吊诡的是,似乎并没有关于这三者区别的文档
  • random_state 设置随机数状态
  • optionsdict 求解器参数

其返回值有三

  • u 即UUU
  • s 即奇异值数组,也就是Σ\SigmaΣ的对角线
  • vh 即VTV^TVT

测试

下面对奇异值分解做个测试

import numpy as np
from scipy.linalg import svd
from scipy.sparse import csc_array
from scipy.sparse.linalg import svds
np.random.seed(42)  # 设置随机数状态
mat = np.random.rand(500,800)
mat[mat<0.9] = 0
csc = csc_array(mat)
u1, s1, vh1 = svds(csc, k=10)
u2, s2, vh2 = svd(mat)

结果是svds得到的结果和svd的前十个值完全相同,只是排序不一样,但也无关紧要。

下面测试一下二者的时间,由于在Windows下用不了propack,所以svds计算的奇异值数最多只能是M−1M-1M1,也就是499,所以只能测试这个和svd返回500个奇异值的结果相比对,结果如下

>>> from timeit import timeit
>>> timeit(lambda : svds(csc, k=499), number=10)
3.651770199999987
>>> timeit(lambda : svd(mat), number=10)
0.47201400000005833

可见,稀疏矩阵在计算上的确是比不上规整的矩阵。

http://www.lryc.cn/news/11286.html

相关文章:

  • 网络安全等级保护基础知识汇总
  • ros1使用过程中遇到的问题记录
  • centos7给已有分区进行扩容
  • package.json
  • 【项目精选】户籍管理系统(视频+论文+源码)
  • 【IP技术】网络安全防护措施
  • 基于AIOT技术的智慧教室智能物联管控系统设计与实现(提纲)
  • C 指针的深造
  • 大数据之-Nifi-应用场景2-2_设置putfile处理器自动创建目标文件夹_以及存在重复文件时自动覆盖---大数据之Nifi工作笔记0006
  • buuctf Web 下
  • 【项目精选】javaEE土地档案管理系统(源码+论文+视频)
  • JVM那些事——垃圾回收和内存分配
  • 什么牌的运动耳机比较好、运动耳机排行榜10强
  • 华为OD机试题 - N 进制减法(JavaScript)
  • MyBatis 之三(查询操作 占位符#{} 与 ${}、like查询、resultMap、association、collection)
  • 【云原生之Docker实战】使用Docker部署Web在线聊天室Rocket.Chat
  • 阿里一面:谈一下你对DDD的理解?2W字,帮你实现DDD自由
  • 嵌入式Linux入门级板卡的神经网络框架ncnn移植与测试-米尔i.MX6UL开发板
  • 扬帆优配|杠杆资金重仓股曝光,3只科创板股获多路资金青睐
  • 资讯汇总230217
  • 前置知识- 初值问题、ode 系列函数的用法、刚性 (stiff) 方程简介、高阶微分方程的降阶
  • # AutoSar一文概览
  • 分享88个HTML旅游交通模板,总有一款适合您
  • C#中GDI+的矩形功能扩展
  • 数字经济活动题
  • html 的相对路径和绝对路径
  • selenium进行QQ空间登录
  • SpringCloud(二)负载均衡服务调用Ribbon、服务接口调用OpenFeign案例详解
  • 大数据第一轮复习笔记(2)
  • 3|射频识别技术|期末考试知识点|第3讲_RFID射频前端|重点题目