0%

模型感知训练

文章参考学习

模型感知训练也是模型量化中的一部分,它主要是在量化过程中,对网络进行训练,从而让网络参数能更好地适应量化带来的信息损失。这种方式会更加灵活,因此准确性普遍从后训练量化要高,但是,同样地,它也存在缺点,如操作起来不方便。

阅读全文 »

人名分类器

关于人名分类问题

  • 以一个人名为输入,使用模型帮助我们判断它最有可能来自哪个国家的人名,这在某些国际化公司的业务中具有重要意义,在用户注册过程中, 会根据用户填写的名字直接给他分配可能的国家或地区选项,以及该国家或地区的国旗,限制手机号码位数等
阅读全文 »

GRU模型

GRU

GRU(Gated Recurrent Unit)也称门控制单元结构,它也是传统RNN的变体,同LSTM一样能够有效捕捉长序列之间的语义关联,缓解梯度消失或爆炸现象。同时它的结构和计算要比LSTM更简单,它的核心结构可以分为两个部分去解析:

阅读全文 »

LSTM模型

LSTM

  • LSTM(Long Short-Term Memory)也称长短时记忆结构,它是传统RNN的变体,与经典RNN相比,能够有效捕捉长序列之间的语义关联,缓解梯度消失或爆炸现象,同时LSTM的结构更复杂,它的核心结构可以分为四个部分去解析:

    • 遗忘门
    • 输入门
    • 细胞状态
    • 输出门
阅读全文 »

RNN架构解析

认识RNN模型

什么是RNN模型

阅读全文 »

新闻主题分类任务

关于新闻主题分类任务

  • 以一段新闻报道中的文本描述内容为输入,使用模型帮助我们判断 它最有可能属于哪一种类型的新闻,这是典型的文本分类问题,这里假定每种类型是互斥的,即文本描述有且只有一种类型
阅读全文 »