Skip to content

Commit 20e2085

Browse files
committed
修改
1 parent 1ac910e commit 20e2085

File tree

15 files changed

+73
-45
lines changed

15 files changed

+73
-45
lines changed

NLPinterview/KG/KBQA/readme.md

Lines changed: 38 additions & 36 deletions
Original file line numberDiff line numberDiff line change
@@ -47,47 +47,49 @@
4747

4848
#### 1.2.2. 问句解析
4949

50-
- 实体抽取:
51-
- 作用:得到匹配的词和类型
52-
- 方法:
53-
- 模式匹配:
54-
- 介绍:主要采用规则 提槽
55-
- 工具:正则表达式
56-
- 词典:
57-
- 介绍:利用词典进行匹配
58-
- 采用的词典匹配方法:trie和Aho-Corasick自动机,简称AC自动机
59-
- 工具:ahocorasick、FlashText 等 python包
60-
- 基于词向量的文本相似度计算:
61-
- 介绍:计算 query 中 实体 与 实体库 中候选实体的相似度,通过设定阈值,得到最相似的 实体
62-
- 工具:词向量工具(TF-idf、word2vec、Bert 等)、相似度计算方法(余弦相似度、L1、L2等)
63-
- 命名实体识别方法:
64-
- 利用 命名实体识别方法 识别 query 中实体
65-
- 方法:BiLSTM-CRF等命名实体识别模型
66-
- 举例说明:
50+
1. 实体抽取:
51+
52+
- 作用:得到匹配的词和类型
53+
- 方法:
54+
- 模式匹配:
55+
- 介绍:主要采用规则 提槽
56+
- 工具:正则表达式
57+
- 词典:
58+
- 介绍:利用词典进行匹配
59+
- 采用的词典匹配方法:trie和Aho-Corasick自动机,简称AC自动机
60+
- 工具:ahocorasick、FlashText 等 python包
61+
- 基于词向量的文本相似度计算:
62+
- 介绍:计算 query 中 实体 与 实体库 中候选实体的相似度,通过设定阈值,得到最相似的 实体
63+
- 工具:词向量工具(TF-idf、word2vec、Bert 等)、相似度计算方法(余弦相似度、L1、L2等)
64+
- 命名实体识别方法:
65+
- 利用 命名实体识别方法 识别 query 中实体
66+
- 方法:BiLSTM-CRF等命名实体识别模型
67+
- 举例说明:
6768

6869
```s
6970
eg:通过解析 上面的 query ,获取里面的实体和实体类型:{'Disease': ['高血压'], 'Symptom': ['高血压'], 'Complication': ['高血压']}
7071
```
7172

72-
- 属性和关系抽取:
73-
- 作用:抽取 query 中 的 属性和关系
74-
- 方法:
75-
- 模式匹配:
76-
- 介绍:主要采用规则匹配
77-
- 工具:正则表达式
78-
- 词典:
79-
- 介绍:利用词典进行匹配
80-
- 采用的词典匹配方法:trie和Aho-Corasick自动机,简称AC自动机
81-
- 工具:ahocorasick、FlashText 等 python包
82-
- 意图识别方法:
83-
- 介绍:采用分类模型 对 query 所含关系 做预测
84-
- 工具:
85-
- 机器学习方法:LR、SVM、NB
86-
- 深度学习方法:TextCNN、TextRNN、Bert 等
87-
- 命名实体识别方法:【同样,可以采用命名实体识别挖掘出 query 中的某些动词和所属类型】
88-
- 利用 命名实体识别方法 识别 query 中实体
89-
- 方法:BiLSTM-CRF等命名实体识别模型
90-
- 举例说明:
73+
2. 属性和关系抽取:
74+
75+
- 作用:抽取 query 中 的 属性和关系
76+
- 方法:
77+
- 模式匹配:
78+
- 介绍:主要采用规则匹配
79+
- 工具:正则表达式
80+
- 词典:
81+
- 介绍:利用词典进行匹配
82+
- 采用的词典匹配方法:trie和Aho-Corasick自动机,简称AC自动机
83+
- 工具:ahocorasick、FlashText 等 python包
84+
- 意图识别方法:
85+
- 介绍:采用分类模型 对 query 所含关系 做预测
86+
- 工具:
87+
- 机器学习方法:LR、SVM、NB
88+
- 深度学习方法:TextCNN、TextRNN、Bert 等
89+
- 命名实体识别方法:【同样,可以采用命名实体识别挖掘出 query 中的某些动词和所属类型】
90+
- 利用 命名实体识别方法 识别 query 中实体
91+
- 方法:BiLSTM-CRF等命名实体识别模型
92+
- 举例说明:
9193

9294
```s
9395
- eg:通过解析 上面的 query ,获取里面的实体和实体类型:

NLPinterview/KG/neo4j/readme.md

Lines changed: 2 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -1,6 +1,8 @@
11
# 【关于 Neo4j 】 那些你不知道的事
22

33
> 作者:吴晓均
4+
>
5+
> 项目地址:https://github.com/km1994/NLP-Interview-Notes
46
57
![](img/微信截图_20210129232419.png)
68

NLPinterview/KG/readme.md

Lines changed: 1 addition & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -2,9 +2,8 @@
22

33
> 作者:吴晓均
44
>
5-
> 项目地址:https://github.com/km1994/nlp_paper_study
5+
> 项目地址:https://github.com/km1994/NLP-Interview-Notes
66
>
7-
> 个人介绍:大佬们好,我叫杨夕,该项目主要是本人在研读顶会论文和复现经典论文过程中,所见、所思、所想、所闻,可能存在一些理解错误,希望大佬们多多指正。
87
98
![](img/微信截图_20210129233513.png)
109

NLPinterview/PreTraining/bert/readme.md

Lines changed: 2 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -172,11 +172,11 @@ BERT(Bidirectional Encoder Representations from Transformers)是一种T**ran
172172
> θ1:是 Mask-LM 任务中在 Encoder 上所接的输出层中的参数;<br/>
173173
> θ2:是句子预测任务中在 Encoder 接上的分类器参数;<br/>
174174
175-
- 在第一部分的损失函数中,如果被 mask 的词集合为 M,因为它是一个词典大小 |V| 上的多分类问题,那么具体说来有:
175+
- 在第一部分的损失函数中,如果被 mask 的词集合为 M,因为它是一个词典大小 |V| 上的多分类问题,所用的损失函数叫做负对数似然函数(且是最小化,等价于最大化对数似然函数),那么具体说来有:
176176

177177
![](img/20201130205229.png)
178178

179-
- 在第一部分的损失函数中,在句子预测任务中,也是一个分类问题的损失函数:
179+
- 在第二部分的损失函数中,在句子预测任务中,也是一个分类问题的损失函数:
180180

181181
![](img/20201130205325.png)
182182

NLPinterview/PreTraining/elmo/readme.md

Lines changed: 4 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -2,6 +2,10 @@
22

33
> 作者:杨夕
44
>
5+
> 项目地址:https://github.com/km1994/NLP-Interview-Notes
6+
>
7+
> 个人论文读书笔记:https://github.com/km1994/nlp_paper_study
8+
>
59
> 【注:手机阅读可能图片打不开!!!】
610
711
![](img/Elmo.png)

NLPinterview/PreTraining/fasttext/readme.md

Lines changed: 4 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -2,6 +2,10 @@
22

33
> 作者:杨夕
44
>
5+
> 项目地址:https://github.com/km1994/NLP-Interview-Notes
6+
>
7+
> 个人论文读书笔记:https://github.com/km1994/nlp_paper_study
8+
>
59
> 【注:手机阅读可能图片打不开!!!】
610
711
![](img/fastText.png)

NLPinterview/PreTraining/tfidf/readme.md

Lines changed: 4 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -2,6 +2,10 @@
22

33
> 作者:杨夕
44
>
5+
> 项目地址:https://github.com/km1994/NLP-Interview-Notes
6+
>
7+
> 个人论文读书笔记:https://github.com/km1994/nlp_paper_study
8+
>
59
> 【注:手机阅读可能图片打不开!!!】
610
711
![](img/TF-idf.png)

NLPinterview/PreTraining/word2vec/readme.md

Lines changed: 4 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -2,6 +2,10 @@
22

33
> 作者:杨夕
44
>
5+
> 项目地址:https://github.com/km1994/NLP-Interview-Notes
6+
>
7+
> 个人论文读书笔记:https://github.com/km1994/nlp_paper_study
8+
>
59
> 【注:手机阅读可能图片打不开!!!】
610
711
![](img/Word2vec.png)

NLPinterview/QA/FAQ/readme.md

Lines changed: 3 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -2,7 +2,9 @@
22

33
> 作者:杨夕
44
>
5-
> 本文链接:https://github.com/km1994/nlp_paper_study
5+
> 项目地址:https://github.com/km1994/NLP-Interview-Notes
6+
>
7+
> 个人论文读书笔记:https://github.com/km1994/nlp_paper_study
68
>
79
> 个人介绍:大佬们好,我叫杨夕,该项目主要是本人在研读顶会论文和复现经典论文过程中,所见、所思、所想、所闻,可能存在一些理解错误,希望大佬们多多指正。
810
>

NLPinterview/TextMatch/ESIM/readme.md

Lines changed: 3 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -2,7 +2,9 @@
22

33
> 作者:杨夕
44
>
5-
> 项目地址:https://github.com/km1994/nlp_paper_study
5+
> 项目地址:https://github.com/km1994/NLP-Interview-Notes
6+
>
7+
> 个人论文读书笔记:https://github.com/km1994/nlp_paper_study
68
>
79
> 个人介绍:大佬们好,我叫杨夕,该项目主要是本人在研读顶会论文和复现经典论文过程中,所见、所思、所想、所闻,可能存在一些理解错误,希望大佬们多多指正。
810
>

0 commit comments

Comments
 (0)