当前位置：首页 > news >正文

Box-Cox 变换

news 2025/8/13 4:09:31

Box-cox 变化公式如下：

$y^{(\lambda)}=\left\{ \begin{aligned} \frac{y^{\lambda} - 1}{\lambda} && \lambda \ne 0 \\ ln(y) && \lambda = 0 \end{aligned} \right.$

$y^{(\lambda)}=\left\{ \begin{aligned} \frac{(y + a)^{\lambda} - 1}{\lambda} && \lambda \ne 0 \\ ln(y + a) && \lambda = 0 \end{aligned} \right.$

根据参数 $\lambda$ 的取值不同，box-cox变换包含了三类函数族：对数函数族、指数函数族、导致函数。

变换的目标是使得变换后因变量线性回归模型的等方差、不相关、正太等假设：

$\bold{y}^{(\lambda)} = \left[\begin{array}{c} y_1^{(\lambda)} \\ y_2^{(\lambda)} \\ ... \\ y_n^{(\lambda)} \end{array}\right]\sim\mathcal{N}(\bold{X}\bold{\beta}, \sigma^2\bold{I})$

$L(\beta,\sigma^2) = (\frac{1}{\sqrt{2\pi}\sigma})^nexp(-\frac{1}{2\sigma^2}(\bold{y}^{(\lambda)} - \bold{X\beta})'(\bold{y}^{(\lambda)} - \bold{X\beta}))\bold{J}$

$\bold{J} = \prod_{i=1}^n|\frac{dy_i^{(\lambda)}}{dy_i}| = \prod_{i=1}^ny_i^{\lambda - 1}$

当 $\lambda$ 固定， $J$ 是不依赖 $\beta,\sigma^2$ 的常数。

求得 $\beta,\sigma^2$ 的最大似然估计为：

$\hat{\beta} = (X'X)^{-1}X'y^{(\lambda)}$

$\hat{\sigma}^2 = \frac{1}{n}y^{(\lambda)'}(I - X(X'X)^{-1}X')y^{(\lambda)} = \frac{1}{n}SSE(\lambda, y^{(\lambda)}), SSE(\lambda, y^{(\lambda)}) = y^{(\lambda)'}(I - X(X'X)^{-1}X')y^{(\lambda)}$

对应的似然函数为：

$L(\hat{\beta}, \hat{\sigma}^2) = (2\pi e \frac{SSE(\lambda, y^{(\lambda)})}{n})^{-\frac{n}{2}} * J$

$lnL(\hat{\beta},\hat{\sigma}^2) = -\frac{n}{2}ln(SSE(\lambda,y^{\lambda})） + ln(J） = -\frac{n}{2}ln(SSE(\lambda, z^{(\lambda)}))$

$z^{(\lambda)} = \frac{y^{(\lambda)}}{\bold{J}}$

为了找出 $\lambda$ 的极大似然估计，使得 $SSE(\lambda,z^{(\lambda)})$ 达到最小即可。

http://www.lryc.cn/news/101508.html

相关文章：

Linux wc命令用于统计文件的行数，字符数，字节数

Python读取多个栅格文件并提取像元的各波段时间序列数据与变化值

Linux 之 wget curl

AngularJS 和 React区别

【Solr】Solr搜索引擎使用

一起学算法（选择排序篇）

智能体的主观和能动

AB 压力测试

多旋翼物流无人机节能轨迹规划（Python代码实现）

Vue通过指令命令将打包好的dist静态文件上传到腾讯云存储桶（保存原有存储目录结构）

Linux 新硬盘分区，挂载

Stable Diffusion 开源模型 SDXL 1.0 发布

NoSQL--------- Redis配置与优化

Ubuntu中关闭防火墙

java-马踏棋盘

系统架构设计师-软件架构设计（4）

51单片机--AD/DA

网络安全-防御需知

C#百万数据处理

windows端口占用

如何理解Diffusion

自然语言处理从入门到应用——LangChain：模型（Models）-[聊天模型（Chat Models）：使用少量示例和响应流式传输]

Java在线OJ项目（三）、前后端交互API模块

项目——负载均衡在线OJ

idea连接远程服务器上传war包文件

使用PyGWalker可视化分析表格型数据

Visual C++中的虚函数和纯虚函数（以外观设计模式为例）

电子元器件选型与实战应用—01 电阻选型

javascript 模板引擎

【数据结构】带头+双向+循环链表（DList）（增、删、查、改）详解