当前位置：首页 > news >正文

9.3 快速傅里叶变换

news 2025/7/27 10:33:15

一、概述

线性代数的很多应用都很难在短时间内介绍清楚，一般都会在完善理论和新增的应用之间做权衡。通常是理论介绍比较多，但是这一节不同，本节介绍的是 $20$ 世纪最有价值的数值计算算法。
在用傅里叶矩阵 $F\pmb F$ 和其逆矩阵 $F−1\pmb{F^{-1}}$ 左乘其它矩阵或向量时，我们希望能更快的计算，快速傅里叶变换（FFT：Fast Fourier Transform） 可以实现这一点。通常情况下计算乘积 $FcF\boldsymbol c$ 需要 $n^2$ 次乘法，这是因为 $n$ 阶傅里叶矩阵 $F$ 有 $n^2$ 个元素，而 FFT 只需要 $12nlog⁡2n\dfrac{1}{2}n\log_2n$ 次乘法。后面会详细介绍。
FFT 彻底改变了信号处理领域，整个产业的发展也被这一思想加速推进。电气工程师首先感受到了这种变换 —— 只要碰到函数，它们就会进行傅里叶变换。傅里叶变换是将 $f$ 表示为谐波函数 $c_ke^{ikx}$ 和的形式。函数 $f$ 通过系数 $c_k$ 被看成频率空间中的元素，而不是物理空间中的函数值 $f (x)$ . 联系系数 $c$ 与函数 $f$ 之间的桥梁就是傅里叶变换，而 FFT 就是这种计算的快速算法。

二、单位根和傅里叶矩阵

二次方程有两个根（或是一个二重根）， $n$ 次方程有 $n$ 个根（计算重数），这是代数的基本定理，为了使得该定理成立，我们允许有复根。这一节关注的是一个特殊的方程 $z^n=1$ ，它的解 $n$ 是 “ $n$ 次单位根（ $n$ th roots of unity）”，在复平面上对应沿着单位圆均匀分布的 $n$ 个点。
Figure 9.4 显示了 $z^8=1$ 的八个根，它们的间隔是 $18(360°)=45°\dfrac{1}{8}(360°)=45°$ . 第一个根位于 $45°$ 或 $θ=2π8\theta=\dfrac{2π}{8}$ 弧度处，它就是复数 $w=eiθ=ei2π/8w=e^{i\theta}=\pmb{e^{i2π/8}}$ . 为了强调这是八次方根，我们将其记为 $w_8$ ，也可以将其写成 $cos⁡2π8\cos\dfrac{2π}{8}$ 和 $sin⁡2π8\sin\dfrac{2π}{8}$ 组合的形式，但是我们不这样写。沿着圆周绕行一周，我们可以得到另外七个八次方根 $,w8w^2,w^3,\cdots,w^8$ 。这些 $w$ 的乘幂最好是用极形式表示，因为我们只会用到角度，这 $8$ 个角度的弧度表示是 $,16π8=2π\dfrac{2π}{8},\dfrac{4π}{8},\cdots,\dfrac{16π}{8}=2π$ ，度数表示就是 $,360°45°,90°,135°,\cdots,360°$ .

在这里插入图片描述
$1$ 的四次方根也在图中，它们分别是 $i, - 1, - i, 1$ ，间隔的角度是 $2π4\dfrac{2π}{4}$ 或 $90°$ ，第一个根 $w_4=e^{2πi/4}$ 就是 $i$ ；甚至 $1$ 的平方根也在图中，第一个根 $w_2=e^{i2π/2}=-1$ ，这里我们不要小瞧了平方根 $1$ 和 $- 1$ . FFT 背后的思想是将 $8×8\pmb{8\times8}$ 的傅里叶矩阵（包含八次方根 $w_8$ 的幂）变换成下面的 $4×4\pmb{4\times4}$ 傅里叶矩阵（包含四次方根 $w_4=i$ 的幂），同样的思想将四阶变换成二阶。通过探究 $F_8$ 降阶到 $F_4$ 以及升阶到 $F_{16}$ （甚至更高阶）的规律，FFT 使得用 $F_{1024}$ 左乘非常迅速。
首先是阶数 $n = 4$ 的傅里叶矩阵，它的行包含 $1,w,w^2$ 和 $w^3$ 以及它们的幂，它们是 $1$ 的四次方根，它们及其幂的排列很特别。 $matrixn=4,w=iF=[11111ww2w31w2w4w61w3w6w9]=[11111ii2i31i2i4i61i3i6i9]\begin{array}{l}\pmb{傅里叶矩阵}\\\textrm{\pmb{Fourier matrix}}\\\pmb{n=4,w=i}\end{array}\kern 15ptF=\begin{bmatrix}1&1&1&1\\1&w&w^2&w^3\\1&w^2&w^4&w^6\\1&w^3&w^6&w^9\end{bmatrix}=\begin{bmatrix}1&1&1&1\\1&i&i^2&i^3\\1&i^2&i^4&i^6\\1&i^3&i^6&i^9\end{bmatrix}$ 这个矩阵是一个对称矩阵， $F=F^T$ ，它不是一个埃尔米特矩阵，因为它的对角线元素不全是实数。但是由于 $(12FH)(12F)=I(\dfrac{1}{2}F^H)(\dfrac{1}{2}F)=I$ ，所以 $12F\dfrac{1}{2}F$ 是一个酉矩阵：

由 $F\pmb F$ 的列向量可得 $FHF=4I\color{blue}\pmb{F^HF=4I}$ ， $F$ 的逆矩阵是 $14FH\pmb{\dfrac{1}{4}F^H}$ ，即 $F−1=14F‾\color{blue}\pmb{F^{-1}=\dfrac{1}{4}\overline F}$ .

逆矩阵中将 $w = i$ 变成 $w‾=−i\overline w=-i$ ，这就将 $F$ 变成了 $F‾\overline F$ ，即可轻松求得逆矩阵 $F^{-1}$ . 当 FFT 实现了用 $F$ 快速左乘时，也就同样快速的实现了用 $F‾\overline F$ 和 $F^{-1}$ 的左乘。
$n$ 阶傅里叶矩阵的每列长度是 $n\sqrt n$ ，所以酉矩阵是 $Q=FnQ=\dfrac{F}{\sqrt n}$ 和 $Q−1=F‾nQ^{-1}=\dfrac{\overline F}{\sqrt n}$ ，我们为了避免使用 $n\sqrt n$ ，所以直接使用 $F$ 和 $F−1=F‾n\pmb{F^{-1}=\dfrac{\overline F}{n}}$ . 重点是用 $F$ 左乘 $c_0,c_1,c_2,c_3)$ ： $series[y0y1y2y3]=Fc=[11111ww2w31w2w4w61w3w6w9][c0c1c2c3](9.3.1)\begin{array}{l}\pmb{4点傅里叶级数}\\\pmb{\textrm{4-point Fourier series}}\end{array}\kern 15pt\begin{bmatrix}y_0\\y_1\\y_2\\y_3\end{bmatrix}=F\boldsymbol c=\begin{bmatrix}1&1&1&1\\1&w&w^2&w^3\\1&w^2&w^4&w^6\\1&w^3&w^6&w^9\end{bmatrix}\begin{bmatrix}c_0\\c_1\\c_2\\c_3\end{bmatrix}\kern 15pt(9.3.1)$ 输入是四个复系数 $c_0,c_1,c_2,c_3$ ，输出是四个函数值 $y_0,y_1,y_2,y_3$ . 第一个输出是 $y_0=c_0+c_1+c_2+c_3$ 是傅里叶级数 $∑k=03ckeikx\sum\limits_{k=0}^3c_ke^{ikx}$ 在 $x = 0$ 处的值，第二个输出是级数 $∑k=03ckeikx\sum\limits_{k=0}^3c_ke^{ikx}$ 在 $x=2π4x=\dfrac{2π}{4}$ 处的值： $y_1=c_0+c_1e^{i2π/4}+c_2e^{i4π/4}+c_3e^{i6π/4}=c_0+c_1w+c_2w^2+c_3w^3$ 第三个输出 $y_2$ 和第四个输出 $y_3$ 是 $∑k=03ckeikx\sum\limits_{k=0}^3c_ke^{ikx}$ 分别在 $x=4π4x=\dfrac{4π}{4}$ 和 $x=6π4x=\dfrac{6π}{4}$ 处的值。这些是有限项傅里叶级数！它们包含 $n = 4$ 项且为等距分布的 $n = 4$ 个点，即点 $x=0,2π4,4π4,6π4x=0,\dfrac{2π}{4},\dfrac{4π}{4},\dfrac{6π}{4}$ 处取值。

按照这个规律，下一个点是 $x=8π4x=\dfrac{8π}{4}$ ，即是 $2 π$ ，而由于 $e^{2πi}=e^0=1$ ，所以级数又回到了 $y_0$ ，每轮循环都以 $4$ 为周期，由于 $w^2)(w^2)=w^0=1$ ，所以在这里指数 $2 + 2$ 与指数 $0$ 是相同的。依照惯例，规定行标 $j\pmb j$ 和列标 $k\pmb k$ 是从 $0\pmb0$ 到 $n−1\pmb{n-1}$ （而不是 $1$ 到 $n$ ）. $F$ 的 “第零行” 和 “第零列” 都是全 $1$ 向量。
$n×nn\times n$ 的傅里叶矩阵 $F_n$ 包含 $w=e^{2πi/n}$ 的幂： $Fnc=[111⋯11ww2⋯wn−11w2w4⋯w2(n−1)⋮⋮⋮⋮1wn−1w2(n−1)⋯w(n−1)2][c0c1c2⋮cn−1]=[y0y1y2⋮yn−1]=y(9.3.2)F_n\boldsymbol c=\begin{bmatrix}1&1&1&\cdots&1\\1&w&w^2&\cdots&w^{n-1}\\1&w^2&w^4&\cdots&w^{2(n-1)}\\\vdots&\vdots&\vdots&&\vdots\\1&w^{n-1}&w^{2(n-1)}&\cdots&w^{(n-1)^2}\end{bmatrix}\begin{bmatrix}c_0\\c_1\\c_2\\\vdots\\c_{n-1}\end{bmatrix}=\begin{bmatrix}y_0\\y_1\\y_2\\\vdots\\y_{n-1}\end{bmatrix}=\pmb y\kern 15pt(9.3.2)$ $F_n$ 是对称矩阵，但不是埃尔米特矩阵。它的列是正交的，且 $FnF‾n=nIF_n\overline F_n=nI$ ，其逆矩阵包含 $w‾n=e−2πi/n\overline w_n=e^{-2πi/n}$ 的幂。观察 $F$ 中元素的特征：

第 $j$ 行，第 $k$ 列的元素为 $w^{jk}$ . 零行零列的元素均为 $w^0=1$ .

当用 $F$ 左乘 $c\boldsymbol c$ 时，相当于在 $n$ 个点处求级数的和。当用 $F_n^{-1}$ 左乘 $y\boldsymbol y$ 时，即是由函数值 $y\boldsymbol y$ 求系数 $c\boldsymbol c$ . 在 MATLAB 中，对应的命令是 $c=fft(y)\boldsymbol c=\textrm{fft}(\boldsymbol y)$ . 矩阵 $F$ 能够将 “频率空间” 转换到 “物理空间” 即 “时域空间”。

重要注释： 很多作者更喜欢使用 $ω=e−2πi/N\omega=e^{-2πi/N}$ ，也就是这里 $w$ 的复共轭。（它们使用的是希腊字母 $ω\omega$ ，这里使用的是英文字母 $w$ .）若使用这种选择，则 DFT 矩阵包含的是 $ω\omega$ 的幂而不是 $w$ 的幂，它就是 $F‾\overline F$ ， $F$ 的共轭。 $F‾\overline F$ 将时域空间变换到频率空间。
$F‾\overline F$ 是一个完全合理的选择！MATLAB 使用的是 $ω=e−2πi/N\omega=e^{-2πi/N}$ ，DFT 矩阵 fft(eye(N)) 包含数值 $w=w‾w=\overline w$ 的幂。傅里叶矩阵 $F$ 的元素是 $w$ 的幂，它由 $c\boldsymbol c$ 重构 $y\boldsymbol y$ ，而 $F‾\overline F$ 的元素是 $ω\omega$ 的幂，它用 fft(y) 来计算傅里叶系数。
另一个重要注释： 当函数 $f (x)$ 的周期是 $2 π$ 时，我们将 $x$ 变为 $eiθe^{i\theta}$ ，则这个函数就被定义在单位圆上（这里 $z=eiθz=e^{i\theta}$ ）. 离散傅里叶变换（Discrete Fourier Transform）等同于插值（interpolation），即求出在 $n$ 个点 $,wn−1z=1,w,\cdots,w^{n-1}$ 处分别取 $n$ 个值 $,fn−1f_0,f_1,\cdots,f_{n-1}$ 的多项式 $p(z)=c0+c1z+⋯+cn−1zn−1p(z)=c_0+c_1z+\cdots+c_{n-1}z^{n-1}$ ：

插值 Interpolation $p(wj)=fj\kern 5pt\color{blue}求出\,c_0,c_1,\cdots,c_{n-1}，使得在\,n\,个点\,z=1,w,\cdots,w^{n-1}\,处有\,p(w^j)=f_j$

傅里叶矩阵就是在 $n$ 个特殊点处插值时所得方程组的范德蒙德矩阵（Vandermonde matrix）.

三、快速傅里叶变换的一步

我们希望用 $F$ 左乘 $c\boldsymbol c$ 时的计算越快越好。正常情况下，一个 $n$ 阶方阵有 $n^2$ 个元素，所以这个矩阵乘一个向量需要计算 $n^2$ 次乘法。如果矩阵中含有零元素，则对应的乘法可以被忽略，但是傅里叶矩阵里没有零元素！所以我们可能以为该算法不可能再得到改进了。而通过将其中的元素改写成特殊的形式 $w^{jk}$ ，将 $F$ 进行分解，从而产生很多零元素，这就是 FFT .
关键思想是将 $Fn\pmb{F_n}$ 与阶数减半的傅里叶矩阵 $Fn/2\pmb{F_{n/2}}$ 联系起来。假设 $n$ 为 $2$ 的幂（比如说 $n=2^{10}=1024$ ），下面我们将要把 $F_{1024}$ 与两个 $F512\pmb{F_{512}}$ 联系起来。
先从 $n = 4$ 开始，关键是建立 $F_4$ 和两个 $F_2$ 之间的联系： $F4=[11111ii2i31i2i4i61i3i6i9],[F2F2]=[111i2111i2]\pmb{F_4}=\begin{bmatrix}1&1&1&1\\1&i&i^2&i^3\\1&i^2&i^4&i^6\\1&i^3&i^6&i^9\end{bmatrix},\kern 15pt\begin{bmatrix}\pmb{F_2}\\&\pmb{F_2}\end{bmatrix}=\begin{bmatrix}1&1\\1&i^2\\&&1&1\\&&1&i^2\end{bmatrix}$ 左边的 $F_4$ 中没有零元素，右边的矩阵有一半的零元素，因此计算量会减半。但是，这两个矩阵还不相等，我们需要两个稀疏且简单的矩阵来完成 FFT 分解： $分解F4=[111i1−11−i][111i2111i2][1111](9.3.3)\pmb{\textrm{FFT}\,分解}\kern 18ptF_4=\begin{bmatrix}1&&1\\&1&&i\\1&&-1\\&1&&-i\end{bmatrix}\begin{bmatrix}1&1\\1&i^2\\&&1&1\\&&1&i^2\end{bmatrix}\begin{bmatrix}1\\&&1\\&1\\&&&1\end{bmatrix}\kern 20pt(9.3.3)$ 最后一个矩阵是置换矩阵，它将偶数号系数（ $c_0$ 和 $c_2$ ）放在了奇数号系数（ $c_1$ 和 $c_3$ ）之前；中间的矩阵分别在偶数号和奇数号系数上执行规模减半的变换 $F_2$ 和 $F_2$ ；左边的矩阵将两个规模减半的输出合并起来，这样就可以得到正确的完整输出 $y=F4c\boldsymbol y=F_4\boldsymbol c$ .
同样的思想也可以应用在 $n = 1024$ 和 $m=12n=512m=\dfrac{1}{2}n=512$ 的情形下。此时数 $w$ 是 $e^{2πi/1024}$ ，它在单位圆弧度 $θ=2π1024\theta=\dfrac{2π}{1024}$ 处，傅里叶矩阵 $F_{1024}$ 中的元素全是 $w$ 的幂。FFT 的第一步就是这项伟大的分解，它是由 Cooley 和 Tukey 给出的（1805 年高斯曾经预言过）：

$F1024=[I512D512I512−D512][F512F512][even-oddpermutation](9.3.4)F_{1024}=\begin{bmatrix}I_{512}&\kern 7ptD_{512}\\I_{512}&-D_{512}\end{bmatrix}\begin{bmatrix}\pmb{F_{512}}\\&\pmb{F_{512}}\end{bmatrix}\begin{bmatrix}\textrm{even-odd}\\\textrm{permutation}\end{bmatrix}\kern 20pt(9.3.4)$

$I_{512}$ 是单位矩阵， $D_{512}$ 是对角矩阵，其对角元素为 $,w5111,w,\cdots,w^{511}$ ；两个 $F_{512}$ 正是我们所期望的，注意这里使用的是 $512$ 次单位根（即 $w^2$ !!）；置换矩阵将输入向量 $c\boldsymbol c$ 分成偶数号部分 $,c1022)\boldsymbol c'=(c_0,c_2,\cdots,c_{1022})$ 和奇数号部分 $,c1023)\boldsymbol c''=(c_1,c_3,\cdots,c_{1023})$ .
下面是代数公式，它与 $F_{1024}$ 的分解描述是一样的：

（FFT 的一步）令 $m=12n\pmb{m=\dfrac{1}{2}n}$ ， $y=Fnc\boldsymbol y=F_n\boldsymbol c$ 的前 $m$ 位分量和后 $m$ 位分量分别为规模减半的变换 $y′=Fmc′\boldsymbol y'=F_m\boldsymbol c'$ 和 $y′′=Fmc′′\boldsymbol y''=F_m\boldsymbol c''$ . 这对应式（9.3.4）中的 $Iy′+Dy′′I\boldsymbol y'+D\boldsymbol y''$ 和 $Iy′−Dy′′I\boldsymbol y'-D\boldsymbol y''$ ，这个等式展示了从 $n$ 到 $m=n2m=\dfrac{n}{2}$ 的步骤： $,m−1(9.3.5)\begin{array}{r}\color{blue}y_j=y_j'+(w_n)^jy_j'',\kern 10ptj=0,1,\cdots,m-1\\\color{blue}y_{j+m}=y'_j-(w_n)^jy''_j,\kern 10ptj=0,1,\cdots,m-1\end{array}\kern 15pt(9.3.5)$ 将 $c\boldsymbol c$ 分为 $c′\boldsymbol c'$ 和 $c′′\boldsymbol c''$ ，用 $F_m$ 分别将它们变换为 $y′\boldsymbol y'$ 和 $y′′\boldsymbol y''$ ，从而（9.3.5）重构了 $y\boldsymbol y$ .

这些公式来自于将 $,cn−1c_0,c_1,\cdots,c_{n-1}$ 分成偶数号 $c_{2k}$ 和奇数号 $c_{2k+1}$ ，这里的 $w$ 是 $w_n$ ： $m=12n(9.3.6)\boldsymbol y=F\boldsymbol c\kern 15pty_j=\sum_{k=0}^{n-1}w^{jk}c_k=\sum_{k=0}^{m-1}w^{2jk}c_{2k}+\sum_{k=0}^{m-1}w^{j(2k+1)}c_{2k+1},\kern 3pt其中\,m=\dfrac{1}{2}n\kern 15pt(9.3.6)$ 上式即（9.3.2）的展开形式，偶数号分量是 $,cn−2)\boldsymbol c'=(c_0,c_2,\cdots,c_{n-2})$ ，奇数号分量是 $,cn−1)\boldsymbol c''=(c_1,c_3,\cdots,c_{n-1})$ ，然后进行变换 $Fmc′F_m\boldsymbol c'$ 和 $Fmc′′F_m\boldsymbol c''$ ，关键是 $wn2=wm\pmb{w^2_n=w_m}$ ，这得到 $w_n^{2jk}=w_m^{jk}$ . $(9.2.6)yj=∑k=0m−1(wm)jkck′+(wn)j∑k=0m−1(wm)jkck′′=yj′+(wn)jyj′′(9.3.7)\pmb{重写\,(9.2.6)}\kern 15pty_j=\sum_{k=0}^{m-1}(w_m)^{jk}c'_k+(w_n)^j\sum_{k=0}^{m-1}(w_m)^{jk}c''_k=y_j'+(w_n)^jy''_j\kern 15pt(9.3.7)$ 当 $j≥mj\ge m$ 时，（9.3.5）中的负号都来自于 $w_n)^j$ 所分解出的 $w_n)^m=-1$ .
MATLAB 中可以使用 conj(F) 或傅里叶逆变换 ifft 轻易的将偶数号与奇数号分量分开，再乘上 $w_n^j$ ，因为 fft 是基于 $ω=w‾=e−2πi/n\omega=\overline w=e^{-2πi/n}$ . $F$ 和 conj(F) 可以通过行置换联系起来。 $FFT步骤y′=ifft(c(0:2:n−2))∗n/2;y′′=ifft(c(1:2:n−1))∗n/2;d=w.^(0:n/2−1)′;y=[y′+d.∗y′′;y′−d.∗y′′];\begin{array}{l}\pmb{\textrm{MATLAB}\,中从}\\\pmb{n\,到\,n/2\,的\,\textrm{FFT}}\\\pmb{步骤}\end{array}\kern 20pt\begin{array}{l}y'=\textrm{ifft}(c(0:2:n-2))*n/2;\\y''=\textrm{ifft}(c(1:2:n-1))*n/2;\\d=w. \verb|^|(0:n/2-1)';\\y=[y'+d.*y'';y'-d.*y''];\end{array}$ 上述代码需要注意的地方：实际上 MATLAB 的标号是从 1 开始的，上述仅仅是伪代码；之所以后面会乘上 $n /2$ ，这是因为 MATLAB 中的 ifft 会自动归一化，即它会除以 $n /2$ ，这里再乘回来，不做归一化。
下面的流程图表明了用规模减半的矩阵 $F_2$ 左乘 $c′\boldsymbol c'$ 和 $c′′\boldsymbol c''$ . 根据这个形状，我们称这个步骤称为 “蝴蝶形 butterflies”，然后将输出 $y′\boldsymbol y'$ 和 $y′′\boldsymbol y''$ 结合起来（用 $D$ 中的 $1, i$ 乘 $y′′\boldsymbol y''$ ，再用 $- D$ 中的 $- 1, - i$ 乘 $y′′\boldsymbol y''$ ），从而得到 $y=F4c\boldsymbol y=F_4\boldsymbol c$ .

在这里插入图片描述
将 $F_n$ 化成两个 $F_m$ 几乎将计算量减半 —— 从分解的矩阵中出现的很多零元素可以看出。这种减半虽然很好但是不够彻底，FFT 的完整思想要更明显，它要节省出远超过一半的时间。

四、利用递归的完整版 FFT

到目前为止，我们只是将 $F_n$ 减少到了 $F_{n/2}$ ，我们还要继续将其减少至 $Fn/4\pmb{F_{n/4}}$ . 将每个 $F_{512}$ 都化成两个 $F_{256}$ ，然后将每个 $F_{256}$ 化成两个 $F_{128}$ . 这就是递归（recursion）.
递归是很多快速算法的底层原理。我们下面进行第 $2$ 步，此时出现了四个 $F_{256}$ 和 $D$ （包含 $ω512\omega_{512}$ 的 $256$ 个幂）. 偶数号中的偶数号 $c0,c4,c8,⋯c_0,c_4,c_8,\cdots$ 会首先出现： $[F512F512]=[IDI−DIDI−D][FFFF][pick0,4,8,⋯pick2,6,10,⋯pick1,5,9,⋯pick3,7,11,⋯]\begin{bmatrix}F_{512}\\&F_{512}\end{bmatrix}=\begin{bmatrix}I&\kern 7ptD\\I&-D\\&&I&\kern 7ptD\\&&I&-D\end{bmatrix}\begin{bmatrix}F\\&F\\&&F\\&&&F\end{bmatrix}\begin{bmatrix}\textrm{pick}&0,4,8,\cdots\\\textrm{pick}&2,6,10,\cdots\\\textrm{pick}&1,5,9,\cdots\\\textrm{pick}&3,7,11,\cdots\end{bmatrix}$ 下面我们来计算单个乘法的次数，以搞清节省了多少计算量。在 FFT 发现之前，一般情况下我们需要 $n^2=(1024)^2$ ，这是有超过一百万次的乘法，可能这样计算并不会花费太长的时间，但是如果需要做很多次变换时（这是比较普遍的），时间的消耗就会非常巨大。而通过 FFT 我们可以节省相当可观的计算量： $12nl\pmb{对于阶数\,n=2^l\,的矩阵，最终的乘法次数由\,n^2\,减少到\,\dfrac{1}{2}nl}$ $1024$ 就是 $2^{10}$ ，所以 $l = 10$ . 那么乘法次数就由最初的 $1024)^2$ 减少到了 $(5) (1024)$ ，即从一百万次减少到了五千多次，减少为原来的 $1200\dfrac{1}{200}$ 了。这也就是为什么说 FFT 在彻底改变了信号处理了。
下面解释乘法次数为什么 $12nl\dfrac{1}{2}nl$ 。由 $n=2^l$ 降到 $n = 1$ 的过程中，总共有 $l$ 个层级。每一级为了重新组合从更低层级而来的规模减半的输出，关于对角矩阵 $D$ 有 $2n\dfrac{2}{n}$ 次乘法，所以可以由此得到最终的 $12nl\dfrac{1}{2}nl$ 次乘法，这个就是 $12nlog⁡2n\dfrac{1}{2}n\log_2n$ .
关于 FFT 这个意义非凡的算法最后一条注记，在对向量分量进行全部偶-奇置换后，这些分量进行 FFT 时的次序有一条令人惊叹的规则。将数字 $0$ 到 $n - 1$ 写成二进制形式（如 $n = 4$ 时的 $00, 01, 10, 11$ ），然后反转每个数字的次序得到： $00, 10, 01, 11$ ，这样得到了位反转排序（bit-reversed order）0,2,1,3，其中偶数排在奇数之前。向量分量按位反转排序，共有 $l=\log_2n$ 次递归步骤，最终的输出 $,yn−1y_0,y_1,\cdots,y_{n-1}$ 就是 $F_n$ 左乘 $c\boldsymbol c$ .
这一节展示了矩阵左乘向量这一基本运算，也有可能对其计算进行优化。