深度学习week5_3

深度学习week5_3

基础模型

翻译模型(seq2seq):

  • 建立一个编码网络,对输入进行编码,也就是进行学习
  • 建立一个解码网络,当所有的输入完了之后对编码后的变量进行解码得到翻译的结果
Read more

深度学习week5_2

深度学习week5_2

词汇表征

将RNN GRU LSTM用于自然语言处理(NLP)

词嵌入:让算法自动的理解一些类似的词

我们上周的理解是这样的,(one-hot)将所有词都存在一个词表里面,但是这样就会导致词和词之间是独立的,比如如下图的情况,orange和apple本来是很相近的两个词,比如下面两个句子都应该学习到后面的一个词是果汁,因为苹果和橙子是相近的两个词,但是如果相互独立就很难这么学习到:

Read more

深度学习week4_4

深度学习week4_4

什么是人脸识别

识别加验证

One-Shot学习

一次学习问题:需要通过单单一张照片去识别一个人

因为通常一个人只会录入它的一张照片,这对于神经网络来说样本数太少,除此之外,如果添加了新的人,就得重新训练模型

一种计算方法——计算相似度(这里的阈值时超参数,并且如果样本新增了一张图片也不会有问题,不需要重新训练,一张一张的比较):

Read more

深度学习week4_3

深度学习week4_3

目标定位

对象位置分类(classification with localization):在一张图中有一个较大的对象,对他进行识别并确认出位置

对象检测(detection):在一张图中有多个对象,对这多个位置对象进行检测识别并确认出位置

在输出中添加位置标签,bx by是物体中心点的坐标,宽bw,高bh,整张图片起始坐标为(0,0),终坐标为(1,1)

Read more

week3_2

week3_2

进行误差分析

比如一个分类猫的分类器,把一些很像猫的狗也错判断了猫

那要专门去处理吗:

  • 如果发现错误判断中将狗认成猫的概率很低就不用去处理了
  • 如果比较高就可以处理,可以在标签中新建一行用来表示是狗
Read more

week3_1

week3_1

为什么是ML策略

优化深度学习时考虑的策略

image-20230710203005397

帮助我们选择更好的算法

Read more

week2_3

week2_3

调试处理

超参数:α β β1 β2 layers ε hidden-units learning-rate decay mini-batch-size

红色是最需要调试的,其次是黄色,再其次是紫色 β是指用momentum是的参数 β1、β2是指用adam所有的参数

Read more