暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

NLP知识树(进阶版)

旺财 2019-04-15
2161

经过这段时间额学习,对NLP知识树进行了一下补充

  • 语言模型【language model】【lm】

    • 预训练【pre-training】

    • 困惑度【perplexity】

    • 偏见检测【bias】

    • 特征工程【Feature Engineering】【fe】

    • 概念包【bag-of-concepts】【boc】

      • 神经向量概念化【neural vector conceptualization】【nvc】

    • 词嵌入【word embedding】【we】

      • 模型:

        • bow

        • word2vec

        • glove

        • elmo

        • fasttext

        • bert

    • 序列模型【sequence model】【sm】

      • 波束搜索【beam search】【bs】

      • 模型:

        • lstm

        • seq2seq

        • doc2vec

    • 多信号【multi signal】【ms】

    • 分词【word segmentation】【ws】

      • 未登录词【out-of-vocabulary】【oov】

      • 汉语分词【chinese word segmentation】【cws】

      • 模型:

        • 条件随机场【crf】

        • 隐马尔可夫模型【hmm】

        • 最大似然估计【maximum likelihood estimation】

        • n元语法【n-gram】

        • 词典树【Tire】

  • 信息抽取【information extraction】【ie】

    • 实体抽取【entity extraction】【ner】(等同于命名实体识别,因此用相同的缩写)

      • 命名实体识别【named entity recognition】【ner】

      • 命名实体消歧【named entity disambiguation】【ned】

      • 实体检测【entity find】【ef】

        • 文本到实体的映射【Text-to-entity】【tte】

      • 实体分类【entity classify】

      • 模型:

        • lstm-crf

    • 关系抽取【relation extraction】【re】

      • 模型:

        • pipeline

        • joint model

        • bootstrap

        • pcnn

        • openie

    • 事件抽取【event extraction】【ee】

    • 指代消解【anaphora resolution】【ar】

      • 共指消歧【coreference disambiguation】【cd】

        • 词义消歧【word sense disambiguation】【wsd】

      • 代词消歧【Pronoun Disambiguation】【pdp】

  • 自然语言理解【natural language understanding】【nlu】

    • 知识图谱【knowledge graph】【kg】

    • 机器阅读【machine reading】【mr】

      • 机器阅读理解【machine reading comprehension】【mrc】

        • 多选阅读理解【Multiple-choice Reading Comprehension】【mcrc】

        • 阅读理解复习【Review Reading Comprehension】【rrc】

    • 信息检索【information retrieval】【ir】

      • 模型:

        • pagerank

        • tf-idf

    • 机器翻译【machine translation】【mt】

      • 神经机器翻译【nmt】

      • 文本规范化【text normalization】【tn】

      • 自动文本简化【Sentence simplification】【ss】

      • 模型:

        • 神经图灵机【Neural Turing Machines】【ntm】

    • 机器推理【machine infrence】【mi】

      • 推理网络【infrence network】【infnet】

      • 常识推理【commonsense reasoning】【cr】

    • 句法分析【parsing】

      • 句法树【parse tree】【spt】

        • 语法分析树【syntactic parse trees】【spt】

      • 词性标注【part-of-speech tagging】【pt】

      • 语义角色标注【semantic role labeling】

    • 口语理解【spoken language understanding】【slu】

    • 语言检查【language check】【lc】

      • 拼写检查【text proofing】

      • 语言用词错误【word usage errors】【wue】

      • 真假检测【right or wrong】【row】

      • 语法纠错【Grammatical error correction】【gec】

    • 意图识别【intent understanding】【iu】

    • 特殊语段识别【special phrase recognition】【spr】

      • 引理理解【lemma】

    • 情感分析【sentiment analysis】【sa】

      • 观点对比【comparative opinion】

      • 极性分类【polarity classification】

      • 直观观点【direct opinion】

      • 星级评分【multi-way scale】

      • 信任【trust】

  • 自然语言生成【natural language generation】【nlg】

    • 文本创作【text indite】【ti】

      • 小说创作【novel indite】【ni】

      • 新闻创作

      • 叙事生成【storytelling】

    • 源码生成【Source code generation】【scg】

    • 问答系统【question answering】【qa】

      • 自动问答系统【question answering system】

      • 机器聊天【machine chat】【mc】

        • 澄清问题【clarification questions】【cq】

        • 情感驱动的对话【affect-driven dialog】【add】

        • 对话状态跟踪【dialogue state tracking】【dst】

    • 自动文本摘要【automatic text summarization】【ats】

      • 语句压缩【sentence compression】

      • 搜索引擎【search engine】

      • 自然语言注释【natrual language annotation】【nla】

    • 文本到动画【text to animation】【tta】

    • 模型:

      • transformer

      • memnn

  • 文本分类【text categorization】【tc】

    • 信息增益【information gain】

    • 抄袭检查【document plagiarism detection】

    • 文档排重【finding overlapping and similar digital documents】

    • 语义指纹【semantic fingerprint】

    • 群体性语言【crowd language】【cl】

    • 模型:

      • 亲和力传播【affinity propagation】

      • k-means

      • 拉格朗日乘子法

      • 最大熵

      • 朴素贝叶斯

      • 支持向量机

      • 潜语义分析【Latent Semantic Analysis】【LSA】

  • 语音识别【speech recognition】【sr】

  • 语音合成【speech synthesis】【ss】

  • 文本朗读【text to speech】【ts】


未来研究的热点主要在LM和NLG,国内普遍对文本生成图像和借助图像生成文本的多一些,国外则对机器聊天的研究多一些。

文章转载自旺财,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论