0%

译:《带掩码的自编码器是可扩展视觉学习器》

论文地址:Masked Autoencoders Are Scalable Vision Learners

这里的"Auto"表示的是不是自动的意思,而是自的意思,在机器学习中有一类模型叫做自模型,如自回归模型,这一大类模型特点就是:标号和样本(y和x)是来自同一个东西的,如在语言模型中,用前面一些词去预测下面一个词,在另一个样本中,这个预测的词可能也会成为这个样本本身的一部分。

阅读全文 »

Actor-Critic

Policy Gradient复习

\[ \nabla \bar R_\theta \approx \frac{1}{N}\sum_{n=1}^N\sum_{t=1}^{T_n}(\sum_{t'=t}^{T_n}\gamma^{t'-t}r_{t'}^n-b)\nabla \log p_\theta(a_t^n|s_t^n) \]

阅读全文 »

Q-Learning介绍

前面已经简单见过Q-Learning,现在回顾加学习新内容。

另一种Critic

阅读全文 »