原创Posted 2023-07-19Updated 2024-09-29深度学习8 minutes read (About 1163 words)

week2_2

Mini-batch梯度下降法

优化算法可以帮助我们快速训练模型

虽然向量化可以帮助我们提高运算速率，但是如果m很大，效率还是很低，因为我们每更新一次参数就需要重新进行正向传播，再更新参数，不断重复

现在选择算法使进行正向传播前先优化参数

可以把训练集分割成小一点的训练集，这些子集叫做mini-batch,如图所示，假设X有5000000个样本将每1000个分成一个集合->x{i}

原创Posted 2023-07-19Updated 2024-09-29深度学习25 minutes read (About 3742 words)

week2_1

训练 _ 开发 _ 测试集

超级参数的选择通过最开始选择然后不断迭代选择最优

训练数据分为三部分：训练集，验证集(dev_set)，测试集

对于小型数据，70train 30test or 60train 20dev_set 20test

大数据:验证集和测试集的占比减少验证集是为了检验那种算法更有效，所以验证集要足够大，但是比如我们有100万条数据，如果20dev_test就是20万条数据，太多了，可能取一万条数据就能进行评估了，然后找出最好的算法，测试集的主要目的是正确评估分类器的性能，所以比如拥有100万条数据，只需要10000条测试集就够了

原创Posted 2023-07-19Updated 2024-09-29深度学习7 minutes read (About 983 words)