总结¶
udacity的课程还是讲得不深入,sndnyang水式的讲了一点内容, 记不了多少内容。 没做他提供的练习, 感觉不是很值得。
大纲¶
四部分:
- 基础?
- 逻辑回归做分类——然而好像没给出模型式子,只给了损失函数
- 随机优化(随机梯度下降)
- 数据和参数调试——并没有讲多少的样子
- 初试
- 深度网络
- 正则化
- 卷积神经网络 convolution neural network
- 应用
- 嵌入 embedings
- 词向量 Word2Vec
- Recurrent Models
- LSTM
softmax¶
$$ S(y_i) = \frac{e^{y_i}}{\sum_j e^{y_j}} $$
One-Hot encoding¶
没整明白
cross-entropy¶
熵
¶
输入, 经过线性模型(逻辑回归)转成, Logits, 再经过softmax转成, 概率值, 再与one-hot encoding labels 一起计算 cross entropy。
以上就是 multinomial logistic classification
其他¶
提到以下内容:
- SGD 随机梯度下降
- rule of 30-- 影响到验证集中30个样例的可以被相信
- 交叉验证可能很慢,所以更多数据往往是正确方法
- SGD技巧:
- 动量(momentum): 即保存梯度的移动平均(running average): $$ M = 0.9M + \Delta J$$, 没确认视频里的符号是什么。
- 学习速率衰减(learning rate decay)
- Rectified linear units(ReLUs)
- 前向反向传播forward/back propagation
- early termination: stop before overfitting
- $L_2$ regularization
- dropout 丢弃法
- cnn
- pooling 池化, max pooling 和 mean pooling
- 1x1 conv
- inception
- 应用一堆