当前位置: 首页 > news >正文

保序回归与金融时序数据

保序回归在回归问题中的作用是通过拟合一个单调递增或递减的函数,来保持数据点的相对顺序特性。

一、保序回归的作用

主要用于以下情况:

1. 有序数据:当输入数据具有特定的顺序关系时,保序回归可以帮助保持这种顺序关系。例如,时间序列数据、评级数据或排序数据等。

2. 无噪声数据:如果数据中存在噪声,即一些离群点或错误标记的数据点,保序回归可能会受到这些异常值的干扰。因此,保序回归更适用于相对干净且有序的数据。

3. 数据平滑:保序回归可以用于平滑数据,消除数据中的波动和噪声,以获得更加稳定的趋势。

4. 非线性关系:当数据中存在非线性的关系时,保序回归可以更好地捕捉这种非线性关系,而不受线性回归的限制。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.isotonic import IsotonicRegression# 构造示例数据
X = np.array([1, 2, 3, 4, 5])  # 自变量
y = np.array([2, 3, 1, 5, 4])  # 因变量# 创建并训练保序回归模型
model = IsotonicRegression()
model.fit(X, y)# 预测新的数据点
new_X = np.array([5, 6, 5.5])
predicted_y = model.predict(new_X)# 输出预测结果
print(predicted_y)

二、保序回归处理金融股票时序数据并可视化

data = {}
data['close'] = pd.read_pickle('close.pkl')['stock_1'].iloc[-500:]
data['open'] = pd.read_pickle('open.pkl')['stock_1'].iloc[-500:]n = len(data['close'])
X = np.array(data['open'].values)
y = data['close'].valuesfrom sklearn.isotonic import IsotonicRegressionir=IsotonicRegression()
y_ir=ir.fit_transform(X,y)plt.figure(figsize=(15,6))
plt.plot(X,y,'r.',markersize=12)
plt.plot(X,y_ir,'g.-',markersize=12)
plt.legend(('Data','Isotonic Fit'))
plt.title("Isotonic Regression")
plt.show()

三、一个小例子

  1. 收集了股票价格和动量因子的历史数据,其中 stock_prices 是股票价格的时间序列数据,momentum_factors 是相应的动量因子数据,target 是标记股票涨跌的目标变量。

  2. 创建一个 IsotonicRegression 对象 model,并使用 fit 方法拟合模型,将动量因子作为自变量,目标变量作为因变量进行训练。

  3. 定义了新的动量因子 new_momentum_factors,并使用 predict 方法对其进行预测,得到相应的股票涨跌预测结果 predicted_target。

# 收集股票价格和动量因子的历史数据
stock_prices = np.array([100, 110, 120, 130, 120, 110, 100])
momentum_factors = np.array([0.5, 0.7, 0.9, 1.2, 0.8, 0.6, 0.4])
target = np.array([1, 1, 1, -1, -1, -1, -1])  # 标记股票涨跌,1为涨,-1为跌# 创建并拟合保序回归模型
model = IsotonicRegression()
model.fit(momentum_factors, target)# 预测新的动量因子对应的股票涨跌
new_momentum_factors = np.array([0.5, 0.4, 0.7])
predicted_target = model.predict(new_momentum_factors)# 输出预测结果
print(predicted_target)
http://www.lryc.cn/news/198743.html

相关文章:

  • 基于单片机设计的家用自来水水质监测装置
  • ubuntu20.04运用startup application开机自启动python程序
  • SpringBoot整合Caffeine实现缓存
  • DVWA-弱会话IDS
  • 【C++中cin、cin.get()、cin.getline()、getline() 的区别】
  • SSH连接华为交换机慢
  • Web攻防03_MySQL注入_数据请求
  • JS加密/解密那些必须知道的事儿
  • 搭建伪分布式Hadoop
  • 【C++】特殊类的设计(只在堆、栈创建对象,单例对象)
  • 分类预测 | MATLAB实现基于GRU-AdaBoost门控循环单元结合AdaBoost多输入分类预测
  • 【Spring Boot项目】根据用户的角色控制数据库访问权限
  • EthernetIP 转MODBUS RTU协议网关连接FANUC机器人作为EthernetIP通信从站
  • 如何注册微信小程序
  • 移动App安全检测的必要性,app安全测试报告的编写注意事项
  • DVWA-JavaScript Attacks
  • 算法通关村第二关|白银|链表反转拓展【持续更新】
  • 开发者职场“生存状态”大调研报告分析 - 第四版
  • 代码与细节(一)
  • AI绘画使用Stable Diffusion(SDXL)绘制中国古代神兽
  • 老卫带你学---leetcode刷题(148. 排序链表)
  • 21.1 stm32使用LTDC驱动LCD--配置说明
  • zabbix监控nginx的状态页面
  • C语言初学者工具选择:vscode + MSYS2 + cmake 搭建 C环境
  • 【四:httpclient的使用】
  • 在innodb引擎中,count(*)、count(1)、count(主键)、count(字段)哪个性能最高?
  • 华为OD 跳格子2(200分)【java】B卷
  • javascript/python 笔记: folium feature group自动切换
  • Python中的元组
  • 在云计算环境中,如何利用 AI 改进云计算系统和数据库系统性能