Skip to content

Commit 9a97866

Browse files
committed
内容修改 v1.0
1 parent 888b274 commit 9a97866

File tree

20 files changed

+18
-18
lines changed

20 files changed

+18
-18
lines changed

NLPinterview/DialogueSystem/readme.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -23,7 +23,7 @@
2323
- 类别:
2424
- 基于 海量 FAQ 的检索方式
2525
- 端到端方式
26-
26+
2727
### 1.2 这几种对话系统的区别?
2828

2929
- 区别:是否有明确的目标和任务

NLPinterview/KG/KBQA/readme.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -9,7 +9,7 @@
99
![](img/微信截图_20210204081440.png)
1010

1111
## 一、基于词典和规则的方法
12-
12+
1313
### 1.1 介绍
1414

1515
#### 1.1.1 开源知识图谱

NLPinterview/KG/readme.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -6,7 +6,7 @@
66
>
77
88
![](img/微信截图_20210129233513.png)
9-
9+
1010
## 一、知识图谱简介
1111

1212
### 1.1 引言

NLPinterview/PreTraining/bert/readme.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -20,7 +20,7 @@
2020
- 维度鸿沟问题:词语的编码往往是随机的,导致不能很好地刻画词与词之间的相似性。
2121

2222
### 1.2【演变史】wordvec 存在问题?
23-
23+
2424
- 多义词问题
2525
- 因为 word2vec 为静态方式,即训练好后,每个词表达固定;
2626

NLPinterview/PreTraining/bert_big/readme.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -17,7 +17,7 @@
1717
## 二、Bert 变大篇
1818

1919
### 2.1 认识 XLNet 么?能不能讲一下? 和 Bert 的 区别在哪里?
20-
20+
2121
- AR vs AE
2222
- AR:只利用到单向 context 的信息(前向或后向);
2323
- AE(这里特指 BERT):Pre-training 阶段引入的 [MASK] 占位符在 Fine-tuning 阶段并不存在;同一个 sequence 如果有多个位置 [MASK],BERT 假定它们之间是独立的,这与事实不符

NLPinterview/PreTraining/bert_zip/readme.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -19,7 +19,7 @@
1919
- 限制了 Bert 系列模型在移动和物联网等嵌入式设备上的部署;
2020

2121
## 二、Bert 模型压缩对比表
22-
22+
2323
<table>
2424
<tr>
2525
<td>论文</td>

NLPinterview/PreTraining/fasttext/readme.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -17,7 +17,7 @@
1717
- 介绍:基于word单词作为基本单位的,这种方式虽然能够很好的对词库中每一个词进行向量表示
1818

1919
### 1.2 word-level Model 存在什么问题?
20-
20+
2121
- OOV 问题
2222
- 问题描述:容易出现单词不存在于词汇库中的情况;
2323
- 解决方法:最佳语料规模,使系统能够获得更多的词汇量;

NLPinterview/PreTraining/tfidf/readme.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -24,7 +24,7 @@
2424

2525
- 维度长:向量的维度为 **词典大小**
2626
- 一一其零:每个向量**只有一个维度为1**,其余维度全部为0,**为1的位置表示该词语在词典的位置**
27-
27+
2828
### 1.4 one-hot 存在哪些问题?
2929

3030
- 维度灾难:容易受维数灾难的困扰,每个词语的维度就是语料库字典的长度;

NLPinterview/PreTraining/word2vec/readme.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -19,7 +19,7 @@
1919
- CBOW vs Skip-gram
2020

2121
### 1.2 Wordvec 中 CBOW 指什么?
22-
22+
2323
- CBOW
2424
- 思想:用周围词预测中心词
2525
- 输入输出介绍:输入是某一个特征词的上下文相关的词对应的词向量,而输出就是这特定的一个词的词向量

NLPinterview/QA/FAQ/readme.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -22,7 +22,7 @@
2222
- 如何根据 这个 query,你怎么返回一个标准答案呢?
2323
- 如何从 问题库 里面找 答案?
2424
- 如何 判断 你 找到 答案 是 对的?
25-
25+
2626
### 1.2 问答系统 是什么?
2727

2828
- 介绍:问答系统是信息检索的一种高级形式,能够更加准确地理解用户用自然语言提出的问题,并通过检索语料库、知识图谱或问答知识库返回简洁、准确的匹配答案。相较于搜索引擎,问答系统能更好地理解用户提问的真实意图, 进一步能更有效地满足用户的信息需求。

0 commit comments

Comments
 (0)