
1、NLTK(natural language toolkit),是python的自然语言处理工具包。
2、Pattern,数据挖掘模块,包括自然语言处理,机器学习工具,等等。
3、textblob,提供API为自然语言处理、分解NLP任务。基于NLTK和Pattern模块。
4、jieba,结巴,中文分词工具。
5、snownlp,用于处理中文文本库。
6、loso,中文分词函数库。
7、genius,中文CRF基础库,条件随机场(conditional random field,简称 CRF),是一种鉴别式机率模型
8、scikits.learn,构建在SciPy之上用于机器学习的 Python 模块
9、PyMC,机器学习采样工具包,PyMC主要用来做Bayesian分析。
10、Orange,基于组件的数据挖掘和机器学习软件套装
11、PyMVPA(Multivariate Pattern Analysis in Python),是为大数据集提供统计学习分析的Python工具包
12、Pylearn2,-基于Theano的机器学习库。
13、hebel,GPU加速,[深度学习]Python库。
14、gensim,机器学习库。
15、pybrain,机器学习模块,它的目标是为机器学习任务提供灵活、易应、强大的机器学习算法。
16、Mahout包含许多实现,包括聚类、分类、推荐过滤、频繁子项挖掘。
17、Crab,灵活的,快速的推荐引擎。
18、python-recsys,娱乐系统分析,推荐系统。
19、vowpal_porpoise,Vowpal Wabbit轻量级Python封装。
20、Theano,用来定义、优化和模拟数学表达式计算,用于高效的解决多维数组的计算问题的python软件包。
相关文章

文章转载自Coding Big Tree,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




