【DL】Deep Learning base
在机器学习中,使用数据来训练模型,使其能够解决特定的问题。模型是由许多参数组成的,通过调整这些参数,可让模型在解决问题时更有效。
在训练模型的过程中,需要定义一个目标函数,用来衡量模型的表现。目标函数可以是一个损失函数,用来衡量模型预测结果与真实结果之间的差距;也可以是一个指标函数,用来衡量模型预测结果的质量。
通常会通过最优化算法来优化目标函数,即找到使目标函数取得最小值的模型参数。常见的最优化算法包括梯度下降法、牛顿法、拟牛顿法等。
数据、模型、目标函数、最优化算法之间是任何一个机器学习算法都涉及的重要组成部分。使用数据来训练模型,使用目标函数来衡量模型的表现,使用最优化算法来优化目标函数,从而获得较优的模型。学习机器学习算法就是要熟悉不同方法在这四方面都是怎么做的,互相之间有什么区别联系,优缺点和适用条件是什么,如何编程实现等问题。
机器学习中的数据通常由两部分组成:特征和标签。
- 特征(feature):特征是描述数据的信息。在机器学习中,使用特征来解决问题,例如分类、回归等。
- 标签(label):标签是数据的结果,也就是我们要预测的结果。例如,在分类问题中,标签可以是类别;在回归问题中,标签可以是数值。
目标函数是机器学习中用来衡量模型性能的一种指标。它是一个数值函数,能够根据模型的输出和真实值,计算出模型的性能。其意义在于,它可以帮助我们判断模型的性能。例如,如果使用的是分类问题的准确率作为目标函数,就可以根据准确率的大小来判断模型的性能。目标函数可以帮助我们调整模型的参数。例如,如果使用的是回归问题的均方误差(MSE)作为目标函数,就可以根据均方误差的大小来调整模型的参数。
监督学习
- 回归问题
- 分类问题
- 序列学习问题(递归神经网络(RNN)和隐马尔可夫模型(HMM))
- 搜索问题
- 推荐问题(分为协同过滤和内容推荐两类)
无监督学习
- 聚类问题
- 降维问题
- 因果推断问题
- 概率生成问题
半监督学习
图像分类、语音识别、文本分类、图像生成、自然语言处理。
强化学习
强化学习的目的是帮助智能体在有限的信息和时间内学习最优决策策略。
强化学习模型由四个部分组成:状态、动作、奖励和策略。
- 状态:状态表示智能体当前所处的环境状态。
- 动作:动作表示智能体可以采取的行为。例如,在游戏中,动作可能包括向左走、向右走、跳跃等。
- 奖励:奖励是智能体获得的反馈信息,用于衡量智能体的行为是否对达到预定目标有益。例如,在游戏中,智能体可能会获得分数作为奖励,而在驾驶车辆中,智能体可能会获得安全驾驶的奖励。
- 策略:策略是智能体决定在特定状态下采取哪种动作的方法。策略可以是确定的,也可以是随机的。例如,在游戏中,智能体可能会根据当前状态来决定向左走或向右走;在驾驶车辆中,智能体可能会根据道路情况决定加速或减速。
(蒙特卡罗强化学习和真实世界强化学习)
深度学习是目前最有效的机器学习技术之一。深度学习模型可以处理非结构化数据,如图像和文本。深度学习模型可以通过网络连接层的形式来表示高度复杂的关系。