文本预处理-文本特征处理
文本特征处理的作用
- 文本特征处理包括为语料添加具有普适性的文本特征,如n-gram特征,以及对加入特征之后的文本语料进行必要的处理,如:长度规范。这些特征处理工作能够有效的将重要的文本特征加入模型训练中,增强模型评估指标
文本预处理的及其作用
文本语料在输送给模型前一般需要一系列的预处理工作,才能符合模型的输入的要求,如:将文本转化成模型需要的张量,规范张量的尺寸等,而且科学的文本预处理环节还将有效指导模型超参数的选择,提升模型的评估指标
文本预处理中包含的主要环节
- 在整个Pytorch框架中,所有的神经网络本质上都是一个autograd packge(自动求导工具包)
- autograd package 提供了一个对Tensors上所有的操作进行自动微分的功能
1 | # 加上后,即使是python2也能使用print()而不是 print xxx |
用过Mac或Linux类系统的朋友们再用Windows系统通常都会很不习惯,其中一个原因就是安装软件、配置环境什么的太麻烦了,而实际上,Windows也是有
包管理工具
的,比如微软的官方的winget(相对新,但很多软件没有)、还有Chocolate(无法修改软件安装路径)、还有就是本次推荐的scoop