【机器学习笔记Ⅰ】1 机器学习
机器学习
机器学习(Machine Learning, ML)是人工智能(AI)的一个分支,致力于研究如何让计算机系统通过从数据中学习来改进性能,而无需显式编程。它的核心思想是:通过算法自动发现数据中的规律或模式,并利用这些规律进行预测或决策。
关键概念
-
学习而非编程
- 传统编程:人类编写明确的规则,计算机执行。
- 机器学习:计算机从数据中自动提取规则(模型),并不断优化。
-
数据驱动
- 机器学习依赖大量数据(如文本、图像、传感器数据等)来训练模型。数据质量直接影响模型效果。
-
模型与算法
- 模型:从数据中学习到的数学表示(如线性方程、神经网络)。
- 算法:训练模型的方法(如决策树、梯度下降)。
主要类型
-
监督学习(Supervised Learning)
- 输入数据带有标签(正确答案),模型学习输入到输出的映射。
- 例子:垃圾邮件分类、房价预测。
- 常用算法:线性回归、支持向量机(SVM)、神经网络。
-
无监督学习(Unsupervised Learning)
- 数据无标签,模型发现隐藏结构(如聚类或降维)。
- 例子:客户分群、异常检测。
- 常用算法:K-Means、主成分分析(PCA)。
-
强化学习(Reinforcement Learning)
- 模型通过与环境交互(试错)学习,以最大化奖励。
- 例子:AlphaGo、自动驾驶。
-
其他类型
- 半监督学习(部分数据有标签)、自监督学习(数据自动生成标签)等。
典型流程
- 数据收集:获取原始数据(如用户行为、传感器数据)。
- 数据预处理:清洗、归一化、特征工程。
- 模型训练:选择算法,用数据训练模型。
- 评估与优化:用测试数据验证模型性能(如准确率)。
- 部署:将模型应用到实际场景(如推荐系统)。
应用场景
- 计算机视觉:人脸识别、医学影像分析。
- 自然语言处理:机器翻译、ChatGPT。
- 推荐系统:电商商品推荐、短视频推送。
- 预测分析:股票趋势、天气预测。
为什么重要?
- 能处理复杂问题(如非结构化数据:图像、语音)。
- 适应动态环境(如实时调整广告策略)。
- 自动化决策,提升效率(如工业质检)。
挑战
- 数据需求大(需高质量标注数据)。
- 模型可解释性差(如深度学习“黑箱”问题)。
- 伦理与隐私问题(如算法偏见)。
简单来说,机器学习让计算机像人类一样从经验中学习,是当前AI爆发的核心技术之一。