深度学习常见模型
- 深度神经网络(Deep Neural Network) DNN
最经典的方法论 - 卷积神经网络(Convolutional Neural Network) CNN
用于图像处理 - 循环神经网络(Recurrent Neural Network) RNN
用于处理序列数据 - 递归神经网络(Recursive Neural Network) RNN
用于处理树形结构数据(具有递归结构) - 生成对抗网络(Generative Adversarial Network) GAN
用于生成数据 如:AI画图,AI写诗 - 深度强化学习(Deep Reinforcement Learning) DRL
用于强化学习
常见损失函数
01损失函数 0-1 loss
0-1损失函数是最简单的损失函数,它表示的是预测值与真实值之间的差值,如果预测值与真实值相等,则损失函数值为0,否则为1。
0-1损失函数可以表示为:
L(y,y’)=I(y=y’)
其中,I为指示函数,当y=y’时,I=1,否则I=0。
0-1损失函数存在以下问题:- 0-1损失函数不连续,不能直接用于梯度下降法。
- 0-1损失函数不能很好地反映预测值与真实值之间的误差大小。
- 0-1损失函数只适用于分类问题,不能用于回归问题。
平方损失函数 Quadratic Loss
平方损失函数是最常用的损失函数之一,它表示的是预测值与真实值之间的平方差值,其表达式为:
L(y,y’)=(y-y’)^2
平方损失函数一般不适用于分类问题.交叉熵损失函数 Cross Entropy Loss
交叉熵损失函数是分类问题中最常用的损失函数之一,它表示的是真实值与预测值之间的交叉熵,其表达式为:
L(y,y’)=-ylog(y’)-(1-y)log(1-y’)
其中,y为真实值,y’为预测值,y’的取值范围为[0,1]。
一般用于分类问题Hinge 损失函数 Hinge Loss
Hinge损失函数是分类问题中最常用的损失函数之一,它表示的是真实值与预测值之间的间隔,其表达式为:
L(y,y’)=max(0,1-y*y’)
其中,y为真实值,y’为预测值,y’的取值范围为[-1,1]。
一般用于分类问题