NumPy
NumPy系统是Python的一种开源的数值计算包 ,包括:1.一个强大的N维数组对象Array
2.比较成熟的(广播)函数库 3.用于整合C/C++和fortran代码的工具包 4.实用的线性代数
。傅里叶变化和随机数生成函数 。numpy和稀疏矩阵运算包scipy配合使用,更加方便
Pip install numpy
NLTK
Natural Language Toolkit,自然语言处理工具包,在NLP领域中,最常使用的一个Python库
Pip install nltk
Gensim
Gensim是一个占内存低,接口简单,免费的Python库,它可以用来从文档中自动提取语义主题,
包含了很多非监督学习算法如TF/IDF,潜在语义分析、隐含迪利克雷分配,层次迪利克雷过程等
Gensim支持word2Vec,Doc2Vec等模型
tensorflow
tensorflow是谷歌基于DistBelief进行研发的第二代人工智能学习系统。
tensorflow可被用于语音识别或图像识别等多项机器学习和深度学习领域
tensorflow是一个采用数据流图,用于数值计算的开源软件库。节点Nodes在途中表示数学操作,
图中的线,则表示在节点间相互联系的多维数据数组,即张量。它灵活的结构让你可以在多种平台上
展开计算,例如台式计算中的一个或多个CPU(或GPU),服务器,移动设备等等。
tensorflow最初由google大脑小组(隶属于google机器智能研究机构)的研究员和工程师们开发出来,
用于机器学习和深度神经网络方面的研究,但这个系统的通用性使其也可广泛用于其他计算领域。