自然语言处理入门
什么是自然语言处理
- 自然语言处理(Natural Language Processing,简称NLP)是计算机科学与语言学中关注于计算机与人类语言间转换的领域
自然语言处理的发展简史
- 1950年,计算机科学之父图灵在论文中提出“机器可以思考吗”这一划时代的问题,从此促成了人类语言学与计算机科学的交融
- 1957~1970,自然语言处理领域开始形成“两大阵营”,基于规则和基于统计
- 1994~1999,基于统计的方法逐渐取得胜利,概率计算开始引入到NLP领域的每个任务中
- 2000~2008,机器学习开始兴起,迅速占领了NLP的主流市场
- 2015~,人工智能时代到来,深度学习技术深刻改变NLP的未来
自然语言处理的应用场景
- 语音助手
- 机器翻译
- 搜索引擎
- 智能问答
- ...
内容概要
文本预处理
文本处理基本方法,文本张量表示,文本数据分析,文本增强方法等
经典序列模型
HMM与CRF模型的作用,使用过程,差异比较以及发展现状等
RNN及其变体
RNN、LSTM、GRU模型的作用,构建,优劣势比较等
Transformer
Transformer模型的作用,细节原理解析,模型构建过程等
迁移学习
fasttext工具的作用,迁移学习理论,NLP标准数据集和预训练模型的使用等