当前位置: 首页 > news >正文

数据挖掘笔记1

课程:清华大学-数据挖掘:理论与算法(国家级精品课)_哔哩哔哩_bilibili

一、Learning Resources

二、Data

  • 数据是最底层的一种表现形式。
  • 数据具有连续性。
  • 从存储上来讲,数据分为逻辑上的和物理层的。
  • 大数据:数据量大、产生速度快、数据种类多、

  

三、The Process of Data Mining 

四、clustering聚类

聚类:把一堆数据分为一组一组的(没有标签)

层次性聚类:

一个一个单独的elements/items,两两去聚。

五、 云计算

把服务器当作一种资源,随着访问需求变化,从云计算的服务商地方租,使利用率变高。

  • Pay As You Go
  • Software as a Service
  • Platform as a Service
  • Infrastructure as a Service

六、并行运算

把问题进行切分,分配到不同的处理器上。

七、

  • 解决数据挖掘:想清楚数据之间到底有没有规律
  • 看问题要全面,要从多个角度、多个维度思考,不能以偏概全。
  • 注意:存在内在分组
  • 不能忘记时间维度。
  • 幸存者偏差问题:

样本可能存在偏差。

http://www.lryc.cn/news/286754.html

相关文章:

  • Spring RabbitMQ那些事(3-消息可靠传输和订阅)
  • 揭秘 Kafka 高性能之谜:一文读懂背后的设计精粹与技术实现
  • canvas绘制美国国旗(USA Flag)
  • Python中的`__all__`魔法函数使用详解
  • Studio One 6 mac 6.5.2 激活版 数字音乐编曲创作
  • GitHub图床TyporaPicGo相关配置
  • FireAlpaca:轻量级、免费的Mac/Win绘图软件,让你的创意如火燃烧!
  • 用 Python 制作可视化 GUI 界面,一键实现自动分类管理文件!
  • 【STM32】USB程序烧录需要重新上电 软件复位方法
  • Java数据结构与算法:图算法之深度优先搜索(DFS)
  • SpringBoot整合QQ邮箱发送验证码
  • 云虚拟主机怎么修改代码?如何修改部署在虚拟主机的网站代码?
  • 电脑加固态硬盘有什么好处
  • LabVIEW电火花线切割放电点位置
  • 信通院发布《全球数字经济白皮书 (2023年)》解析
  • Spring5系列学习文章分享---第三篇(AOP概念+原理+动态代理+术语+Aspect+操作案例(注解与配置方式))
  • BL0942 内置时钟免校准计量芯片 用于智能家居领域 上海贝岭 低成本 使用指南
  • 【算法专题】动态规划之路径问题
  • Python range函数
  • Unity中实现捏脸系统
  • openssl3.2 - 检查rsa证书和私钥是否匹配(快速手搓一个工具)
  • 关于网络协议的笔记
  • 【江科大】STM32:USART串口(理论部分)上
  • 深入了解Linux中常见的五种文件类型
  • SSM项目集成Spring Security 4.X版本(使用spring-security.xml 配置文件方式)
  • 如何生成开发语言的排名图表
  • 有哪些简单好用、适合中小型企业的CRM系统?
  • Unity 适配器模式(实例详解)
  • Spring boot项目java bean和xml互转
  • 数字证书和数字证书认证机构和数字根证书,CA,RCA