当前位置: 首页 > article >正文

从万有引力到深度学习,认识模型思维

从万有引力到深度学习,认识模型思维

引言

从牛顿发现万有引力定律到现代深度学习的崛起,“模型思维”始终是人类理解世界、解决问题的核心工具。它不仅是科学研究的基石,更是技术创新的底层逻辑。本文将从科学史、技术应用、认知效率等角度,系统阐述掌握模型思维的必要性。

一、模型是一种跨越时空的认知工具

1. 科学史上的经典模型

万有引力定律:牛顿通过抽象行星运动规律,建立了物理世界的统一模型,解释了有前提条件的天体运行规律。

2. 模型的本质

模型是对现实问题的抽象化表达(三十三重天、十八层地狱、地球仪和deepseek等),可以是错的、可以是未被证实的、可以是互相矛盾的。

3. 什么模型是好的模型

表达客观事物的能力
简化客观事物的能力

4. 评价模型的好坏

  1. 准确率(precision):表示得到的结果中有多少是正确结果的比例
  2. 召回率(recall):表示有多少比例好的结果被正确得到了

二、如何看待和使用模型

模型要在一定场景下起作用,越是普世的模型,越难实现,无他,因为这个世界太复杂,想想如果将这个世界抽象成一个模型,大家都在这个模型上跳舞,好像也有点无趣的可怕。

所以,场景也是模型适用的范围约束。

1. 正确性

比如搜索引擎和推理模型的检测结果,有有用和无用之分,有正确和错误之分。搜索引擎的搜索结果可能会受到算法、数据质量等多种因素的影响,有些结果可能与用户的需求不相关或者不准确。推理模型在进行推理时,也可能会因为输入数据的不完整或者模型本身的局限性而得出错误的结论。因此,在使用这些模型时,我们需要对结果进行批判性的评估,判断其正确性和实用性,而这些判断的数据又可以作为人类的反馈数据再作用于模型的优化过程中(比如强化学习)。

2. 历史作用

模型具备历史特征,大部分情况都是一个时代发展下的过渡产物,一面推动,一面阻碍。比如早期的宗教科学。

3. 发展

模型是不断发展的,因为模型是对现实世界的抽象,世界在变化,模型当然也要发展。在计算机科学领域,早期的计算机模型主要是基于冯·诺依曼架构,随着技术的发展,人们发现这种架构在处理大规模数据和并行计算时存在一定的局限性。于是,出现了各种新的计算模型,如量子计算模型、神经网络模型等,这些新模型能够更好地适应现代科技发展的需求。

4. 模型思维是什么

我上学的时候,处理比较多的是数字信号,使用了一些对序列建模的方法建立模型,再由模型对时序数据进行实时处理。
在深度学习早期的时候,将分类作为攻克的难题,所以,应运而生了感知机等为了分类的模型;在深度学习蓬勃发展时,基于视觉的分类、检测、分割等不同任务的导向,又催成了不同的模型产生 笔者文章:(视觉)分类、检测与分割在不同网络中的设计体现;再然后伴随着NLP领域的LLM应用爆炸,各种大型语言模型不断涌现,如GPT系列、BERT等,这些模型在自然语言处理的各个任务中取得了显著的成果。

模型思维是一种基于模型来思考和解决问题的思维方式。它要求我们能够根据不同的问题和场景,选择合适的模型,并对模型进行评估和改进。在面对复杂的现实问题时,我们可以通过构建模型来简化问题,抓住问题的关键因素,从而找到有效的解决方案。

三、为什么需要模型思维

世界是复杂的,包含着无数的信息和变量。如果我们试图去理解和处理所有的细节,将会陷入信息的海洋中,难以把握事物的本质。模型思维能够帮助我们对复杂的现实进行抽象和简化,提取出关键的信息和规律。

可以提高对世界的认知,可以推动科学研究(气象模型)、技术创新(计算机视觉),可以帮助决策(市场预测)。例如,人工智能领域,深度学习模型的不断发展和创新,推动了图像识别、语音识别、自然语言处理等技术的快速进步,对日常生活带来的变化不可谓不大。

参考:

  1. 龚才春.《模型的本质:简化时间的人工智能模型》
http://www.lryc.cn/news/2386641.html

相关文章:

  • 2022 年 9 月青少年软编等考 C 语言八级真题解析
  • FPGA通信之VGA与HDMI
  • Leetcode百题斩-二叉树
  • 修改 K8S Service 资源类型 NodePort 的端口范围
  • ACM Latex模板:合并添加作者和单位
  • 爬虫IP代理技术深度解析:场景、选型与实战应用
  • 将MCP(ModelContextProtocol)与Semantic Kernel集成(调用github)
  • 游戏引擎学习第311天:支持手动排序
  • LambdaQueryWrapper、MybatisPlus提供的基本接口方法、增删改查常用的接口方法、自定义 SQL
  • 深度学习---可视化
  • 军事大模型及其应用分析
  • c++算法题
  • 云原生安全 SaaS :从基础到实践
  • 《Drain日志解析算法》论文阅读笔记
  • MMAction2重要的几个配置参数
  • Windows系统如何查看ssh公钥
  • UniApp+Vue3微信小程序二维码生成、转图片、截图保存整页
  • 8.2 线性变换的矩阵
  • 【2025】嵌入式软考中级部分试题
  • Antd中Upload组件封装及使用:
  • Linux环境基础开发工具->vim
  • 跳板问题(贪心算法+细节思考)
  • RuoYi前后端分离框架集成UEditorPlus富文本编辑器
  • IPD流程落地:项目任务书Charter开发
  • Vue 2 混入 (Mixins) 的详细使用指南
  • day020-sed和find
  • OpenGL Chan视频学习-4 Vertex Buffers and Drawing a Triangle in OpenGL
  • 数据库事务的四大特性(ACID)
  • 网络安全全知识图谱:威胁、防护、管理与发展趋势详解
  • FreeRTOS 在物联网传感器节点的应用:低功耗实时数据采集与传输方案