鱼C论坛

 找回密码
 立即注册

4.NLP常用Python开发包的介绍

已有 71 次阅读2019-7-23 18:52 |个人分类:自然语言


    NumPy
        NumPy系统是Python的一种开源的数值计算包 ,包括:1.一个强大的N维数组对象Array
        2.比较成熟的(广播)函数库 3.用于整合C/C++和fortran代码的工具包 4.实用的线性代数
        。傅里叶变化和随机数生成函数 。numpy和稀疏矩阵运算包scipy配合使用,更加方便
        Pip install numpy

    NLTK
        Natural Language Toolkit,自然语言处理工具包,在NLP领域中,最常使用的一个Python库
        Pip install nltk

    Gensim
        Gensim是一个占内存低,接口简单,免费的Python库,它可以用来从文档中自动提取语义主题,
        包含了很多非监督学习算法如TF/IDF,潜在语义分析、隐含迪利克雷分配,层次迪利克雷过程等
        Gensim支持word2Vec,Doc2Vec等模型

    tensorflow
        tensorflow是谷歌基于DistBelief进行研发的第二代人工智能学习系统。
        tensorflow可被用于语音识别或图像识别等多项机器学习和深度学习领域
        tensorflow是一个采用数据流图,用于数值计算的开源软件库。节点Nodes在途中表示数学操作,
        图中的线,则表示在节点间相互联系的多维数据数组,即张量。它灵活的结构让你可以在多种平台上
        展开计算,例如台式计算中的一个或多个CPU(或GPU),服务器,移动设备等等。
        tensorflow最初由google大脑小组(隶属于google机器智能研究机构)的研究员和工程师们开发出来,
        用于机器学习和深度神经网络方面的研究,但这个系统的通用性使其也可广泛用于其他计算领域。
        

路过

鸡蛋

鲜花

握手

雷人

全部作者的其他最新日志

评论 (0 个评论)

facelist

您需要登录后才可以评论 登录 | 立即注册

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-5-25 23:04

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

返回顶部