《PRUNING CONVOLUTIONAL NEURAL NETWORKS FOR RESOURCE EFFICIENT INFERENCE》

发表于 2022-04-27 更新于 2023-07-20 分类于论文阅读
本文字数： 5.9k 阅读时长 ≈ 5 分钟

译：《用于资源高效推理的卷积神经网络剪枝》

论文地址：PRUNING CONVOLUTIONAL NEURAL NETWORKS FOR RESOURCE EFFICIENT INFERENCE

Motivation

阅读全文 »

《PRUNING FILTERS FOR EFFICIENT CONVNETS》

发表于 2022-04-26 更新于 2023-07-20 分类于论文阅读
本文字数： 2.6k 阅读时长 ≈ 2 分钟

译：《高效卷积网络的剪枝滤波器》

论文地址：PRUNING FILTERS FOR EFFICIENT CONVNETS

Motivation

阅读全文 »

《Learning Structured Sparsity in Deep Neural Networks》

发表于 2022-04-25 更新于 2023-07-20 分类于论文阅读
本文字数： 2.4k 阅读时长 ≈ 2 分钟

译：《深度神经网络结构稀疏性学习》

论文地址：Learning Structured Sparsity in Deep Neural Networks

Motivation

阅读全文 »

无root配置CUDA

发表于 2022-04-23 更新于 2023-07-20 分类于工具使用教程
本文字数： 1.3k 阅读时长 ≈ 1 分钟

下载cuda和cudnn

下载cuda：

1	wget https://developer.download.nvidia.com/compute/cuda/11.2.0/local_installers/cuda_11.2.0_460.27.04_linux.run

阅读全文 »

《Data-free Parameter Pruning for Deep Neural Networks》

发表于 2022-04-20 更新于 2023-07-20 分类于论文阅读
本文字数： 2.2k 阅读时长 ≈ 2 分钟

译：《深度神经网络无数据参数剪枝》

论文地址：Data-free Parameter Pruning for Deep Neural Networks

Motivation

阅读全文 »

《Learning both Weights and Connections for Efficient Neural Networks》

发表于 2022-04-19 更新于 2023-07-20 分类于论文阅读
本文字数： 1.2k 阅读时长 ≈ 1 分钟

译：《有效神经网络的权重和连接学习》

论文地址：Learning both Weights and Connections for Efficient Neural Networks

Motivation

阅读全文 »

《Masked Autoencoders Are Scalable Vision Learners》

发表于 2022-04-12 更新于 2023-07-20 分类于论文阅读
本文字数： 1.5k 阅读时长 ≈ 1 分钟

译：《带掩码的自编码器是可扩展视觉学习器》

论文地址：Masked Autoencoders Are Scalable Vision Learners

这里的"Auto"表示的是不是自动的意思，而是自的意思，在机器学习中有一类模型叫做自模型，如自回归模型，这一大类模型特点就是：标号和样本(y和x)是来自同一个东西的，如在语言模型中，用前面一些词去预测下面一个词，在另一个样本中，这个预测的词可能也会成为这个样本本身的一部分。

阅读全文 »

《AN IMAGE IS WORTH 16X16 WORDS:TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE》

发表于 2022-04-11 更新于 2023-07-20 分类于论文阅读
本文字数： 1.7k 阅读时长 ≈ 2 分钟

译：《一张图片等价于很多16x16单词：按比例进行图像识别的Transformer》

论文地址：AN IMAGE IS WORTH 16X16 WORDS:TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE

Motivation

阅读全文 »

A3C和其它

发表于 2022-04-03 更新于 2023-07-20 分类于强化学习
本文字数： 2.7k 阅读时长 ≈ 2 分钟

Actor-Critic

Policy Gradient复习

\[ \nabla \bar R_\theta \approx \frac{1}{N}\sum_{n=1}^N\sum_{t=1}^{T_n}(\sum_{t'=t}^{T_n}\gamma^{t'-t}r_{t'}^n-b)\nabla \log p_\theta(a_t^n|s_t^n) \]

阅读全文 »

Q-Learning

发表于 2022-04-01 更新于 2023-07-20 分类于强化学习
本文字数： 3.1k 阅读时长 ≈ 3 分钟

Q-Learning介绍

前面已经简单见过Q-Learning，现在回顾加学习新内容。

另一种Critic

阅读全文 »