干货 | 陪伴我学习NLP、知识图谱的那些资源(教程+书籍+网站+工具+论文...可以说很全面了)

/ 工具 / 没有评论 / 1702浏览

干货 | 陪伴我学习NLP、知识图谱的那些资源(教程+书籍+网站+工具+论文...可以说很全面了)

【人工智能头条导读】作者一年前整理了这份关于 NLP 与知识图谱的参考资源,涵盖内容与形式也是非常丰富,接下来人工智能头条还会继续努力,分享更多更好的新资源给大家,也期待能与大家多多交流,一起成长。

NLP参考资源

自然语言处理(Natural Language Processing)是深度学习的主要应用领域之一。

▌教程

▌书籍

注:Steven Bird,爱丁堡大学博士,墨尔本大学副教授。 http://www.stevenbird.net/about.html Ewan Klein,苏格兰人,哥伦比亚大学博士(1978年),爱丁堡大学教授。 Edward Loper,宾夕法尼亚大学博士。

▌网站

▌工具

参考: http://www.cnblogs.com/baiboy/p/nltk3.html

pip install --upgrade gensim

GitHub 地址: https://github.com/RaRe-Technologies/gensim 参考学习: 情感分析的新方法——基于Word2Vec/Doc2Vec/Python http://www.open-open.com/lib/view/open1444351655682.html Gensim Word2vec使用教程 http://blog.csdn.net/Star_Bob/article/details/47808499

代码: https://github.com/tensorflow/models/tree/master/textsum 参考: http://www.jiqizhixin.com/article/1449 谷歌开源新的TensorFlow文本自动摘要代码:TensorFlow文本摘要生成 - 基于注意力的序列到序列模型 http://blog.csdn.net/tensorflowshizhan/article/details/69230070

参考: 这个网页对于NLP的大多数功能进行了可视化的展示。NLP入门必看。 http://ictclas.nlpir.org/nlpir/

作者blog: http://www.hankcs.com/ Github: https://github.com/hankcs/HanLP/ 从作者的名气来说,HanLP无疑是最低的,性能也不见得有多好。然而对于初学者来说,这却是最适合的工具。这主要体现在以下几个方面: 1.中文处理能力。NLTK和OpenNLP对中文支持非常差,这里不光是中文分词的问题,有些NLP算法需要一定的语言模型数据,但浏览NLTK官方的模型库,基本找不到中文模型数据。 2.jieba、IK之类的功能太单一,多数局限在中文分词方面领域。gensim、THUCTC专注于NLP的某一方面,也不是通用工具。 3.NLPIR和Stanford CoreNLP算是功能最强的工具包了。前者的问题在于收费不开源,后者的问题在于缺少中文文档。FudanNLP的相关文档较少,文档友好度不如HanLP。 4.HanLP在主页上提供了相关算法的blog,便于初学者快速掌握相关概念。其词典是明文发布,便于用户修改。HanLP执行时,会将明文词典以特定结构缓存,以提高执行效率。 注:不要以为中文有分词问题,就比别的语言复杂,英文还有词根问题呢。。。每种语言都不简单。

Allen AI实验室由微软联合创始人Paul G. Allen投资创立。 http://allenai.org/

python版的汉字转拼音软件

https://github.com/mozillazg/python-pinyin

Java分布式中文分词组件-word分词

https://github.com/ysc/word

jena是一个语义网络、知识图谱相关的软件。

http://jena.apache.org/

Github: https://github.com/NLPchina

那么问题就来了,这样两个不同的单词会不会产出相同的tri-grams,paper里面做了统计,说了这个冲突的概率非常的低,500K个word可以降到30k维,冲突的概率为0.0044%。 但是在中文场景下,这个Word Hashing估计没有这么有效了。

词汇共现是指词汇在文档集中共同出现。以一个词为中心,可以找到一组经常与之搭配出现的词,作为它的共现词汇集。 词汇共现的其中一种用例: 有若干关键词,比如:水果、天气、风,有若干描述词,比如,很甜、晴朗、很大,然后现在要找出他们之间的搭配,在这个例子里,我们最终要找到:水果很甜、天气晴朗、风很大

知识图谱参考资源

原文链接: https://blog.csdn.net/antkillerfarm/article/details/78082564