深度学习笔记


深度学习常见模型

  • 深度神经网络(Deep Neural Network) DNN
    最经典的方法论
  • 卷积神经网络(Convolutional Neural Network) CNN
    用于图像处理
  • 循环神经网络(Recurrent Neural Network) RNN
    用于处理序列数据
  • 递归神经网络(Recursive Neural Network) RNN
    用于处理树形结构数据(具有递归结构)
  • 生成对抗网络(Generative Adversarial Network) GAN
    用于生成数据 如:AI画图,AI写诗
  • 深度强化学习(Deep Reinforcement Learning) DRL
    用于强化学习

常见损失函数

  • 01损失函数 0-1 loss
    0-1损失函数是最简单的损失函数,它表示的是预测值与真实值之间的差值,如果预测值与真实值相等,则损失函数值为0,否则为1。
    0-1损失函数可以表示为:
    L(y,y’)=I(y=y’)
    其中,I为指示函数,当y=y’时,I=1,否则I=0。
    0-1损失函数存在以下问题:

    1. 0-1损失函数不连续,不能直接用于梯度下降法。
    2. 0-1损失函数不能很好地反映预测值与真实值之间的误差大小。
    3. 0-1损失函数只适用于分类问题,不能用于回归问题。
  • 平方损失函数 Quadratic Loss
    平方损失函数是最常用的损失函数之一,它表示的是预测值与真实值之间的平方差值,其表达式为:
    L(y,y’)=(y-y’)^2
    平方损失函数一般不适用于分类问题.

  • 交叉熵损失函数 Cross Entropy Loss
    交叉熵损失函数是分类问题中最常用的损失函数之一,它表示的是真实值与预测值之间的交叉熵,其表达式为:
    L(y,y’)=-ylog(y’)-(1-y)log(1-y’)
    其中,y为真实值,y’为预测值,y’的取值范围为[0,1]。
    一般用于分类问题

  • Hinge 损失函数 Hinge Loss
    Hinge损失函数是分类问题中最常用的损失函数之一,它表示的是真实值与预测值之间的间隔,其表达式为:
    L(y,y’)=max(0,1-y*y’)
    其中,y为真实值,y’为预测值,y’的取值范围为[-1,1]。
    一般用于分类问题


文章作者: Wanheng
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 Wanheng !
评论
  目录