经过这段时间额学习,对NLP知识树进行了一下补充

语言模型【language model】【lm】
预训练【pre-training】
困惑度【perplexity】
偏见检测【bias】
特征工程【Feature Engineering】【fe】
概念包【bag-of-concepts】【boc】
神经向量概念化【neural vector conceptualization】【nvc】
词嵌入【word embedding】【we】
模型:
bow
word2vec
glove
elmo
fasttext
bert
序列模型【sequence model】【sm】
波束搜索【beam search】【bs】
模型:
lstm
seq2seq
doc2vec
多信号【multi signal】【ms】
分词【word segmentation】【ws】
未登录词【out-of-vocabulary】【oov】
汉语分词【chinese word segmentation】【cws】
模型:
条件随机场【crf】
隐马尔可夫模型【hmm】
最大似然估计【maximum likelihood estimation】
n元语法【n-gram】
词典树【Tire】
信息抽取【information extraction】【ie】
实体抽取【entity extraction】【ner】(等同于命名实体识别,因此用相同的缩写)
命名实体识别【named entity recognition】【ner】
命名实体消歧【named entity disambiguation】【ned】
实体检测【entity find】【ef】
文本到实体的映射【Text-to-entity】【tte】
实体分类【entity classify】
模型:
lstm-crf
关系抽取【relation extraction】【re】
模型:
pipeline
joint model
bootstrap
pcnn
openie
事件抽取【event extraction】【ee】
指代消解【anaphora resolution】【ar】
共指消歧【coreference disambiguation】【cd】
词义消歧【word sense disambiguation】【wsd】
代词消歧【Pronoun Disambiguation】【pdp】
自然语言理解【natural language understanding】【nlu】
知识图谱【knowledge graph】【kg】
机器阅读【machine reading】【mr】
机器阅读理解【machine reading comprehension】【mrc】
多选阅读理解【Multiple-choice Reading Comprehension】【mcrc】
阅读理解复习【Review Reading Comprehension】【rrc】
信息检索【information retrieval】【ir】
模型:
pagerank
tf-idf
机器翻译【machine translation】【mt】
神经机器翻译【nmt】
文本规范化【text normalization】【tn】
自动文本简化【Sentence simplification】【ss】
模型:
神经图灵机【Neural Turing Machines】【ntm】
机器推理【machine infrence】【mi】
推理网络【infrence network】【infnet】
常识推理【commonsense reasoning】【cr】
句法分析【parsing】
句法树【parse tree】【spt】
语法分析树【syntactic parse trees】【spt】
词性标注【part-of-speech tagging】【pt】
语义角色标注【semantic role labeling】
口语理解【spoken language understanding】【slu】
语言检查【language check】【lc】
拼写检查【text proofing】
语言用词错误【word usage errors】【wue】
真假检测【right or wrong】【row】
语法纠错【Grammatical error correction】【gec】
意图识别【intent understanding】【iu】
特殊语段识别【special phrase recognition】【spr】
引理理解【lemma】
情感分析【sentiment analysis】【sa】
观点对比【comparative opinion】
极性分类【polarity classification】
直观观点【direct opinion】
星级评分【multi-way scale】
信任【trust】
自然语言生成【natural language generation】【nlg】
文本创作【text indite】【ti】
小说创作【novel indite】【ni】
新闻创作
叙事生成【storytelling】
源码生成【Source code generation】【scg】
问答系统【question answering】【qa】
自动问答系统【question answering system】
机器聊天【machine chat】【mc】
澄清问题【clarification questions】【cq】
情感驱动的对话【affect-driven dialog】【add】
对话状态跟踪【dialogue state tracking】【dst】
自动文本摘要【automatic text summarization】【ats】
语句压缩【sentence compression】
搜索引擎【search engine】
自然语言注释【natrual language annotation】【nla】
文本到动画【text to animation】【tta】
模型:
transformer
memnn
文本分类【text categorization】【tc】
信息增益【information gain】
抄袭检查【document plagiarism detection】
文档排重【finding overlapping and similar digital documents】
语义指纹【semantic fingerprint】
群体性语言【crowd language】【cl】
模型:
亲和力传播【affinity propagation】
k-means
拉格朗日乘子法
最大熵
朴素贝叶斯
支持向量机
潜语义分析【Latent Semantic Analysis】【LSA】
语音识别【speech recognition】【sr】
语音合成【speech synthesis】【ss】
文本朗读【text to speech】【ts】
未来研究的热点主要在LM和NLG,国内普遍对文本生成图像和借助图像生成文本的多一些,国外则对机器聊天的研究多一些。




