0%

自然语言处理入门

自然语言处理入门

什么是自然语言处理

  • 自然语言处理(Natural Language Processing,简称NLP)是计算机科学与语言学中关注于计算机与人类语言间转换的领域

自然语言处理的发展简史

  • 1950年,计算机科学之父图灵在论文中提出“机器可以思考吗”这一划时代的问题,从此促成了人类语言学与计算机科学的交融
  • 1957~1970,自然语言处理领域开始形成“两大阵营”,基于规则和基于统计
  • 1994~1999,基于统计的方法逐渐取得胜利,概率计算开始引入到NLP领域的每个任务中
  • 2000~2008,机器学习开始兴起,迅速占领了NLP的主流市场
  • 2015~,人工智能时代到来,深度学习技术深刻改变NLP的未来

自然语言处理的应用场景

  • 语音助手
  • 机器翻译
  • 搜索引擎
  • 智能问答
  • ...

内容概要

文本预处理

文本处理基本方法,文本张量表示,文本数据分析,文本增强方法等

经典序列模型

HMM与CRF模型的作用,使用过程,差异比较以及发展现状等

RNN及其变体

RNN、LSTM、GRU模型的作用,构建,优劣势比较等

Transformer

Transformer模型的作用,细节原理解析,模型构建过程等

迁移学习

fasttext工具的作用,迁移学习理论,NLP标准数据集和预训练模型的使用等