链接:https://www.zhihu.com/question/20501628/answer/126155557
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
我来说一说我做机器学习、深度学习这一块用到的库吧,我是偏自然语言处理这个方向的,我主要介绍第三方库,请使用Python3!!!请使用Python3!!!请使用Python3!!!
数学计算三件套:
numpy
简单介绍:只要涉及到数值计算,基本上三件套都会用上
链接:NumPy — NumPy
scipy
简单介绍:只要涉及到数值计算,基本上三件套都会用上
链接:SciPy.org — SciPy.org
matplotlib
简单介绍:只要涉及到数值计算,基本上三件套都会用上
链接:matplotlib: python plotting
数据处理库
pandas
简单介绍:让数据能够像excel或者r语言一样轻松处理,非常高效的一个包
链接:Python Data Analysis Library
机器学习库
scikit-learn
简单介绍:非常流行的机器学习包,强烈推荐
链接:scikit-learn: machine learning in Python
【注意:只要安装了anaconda,Download Anaconda Now!,以上包都会自动帮你安装好,请使用Python3!!!请使用Python3!!!请使用Python3!!!】
xgboost
简单介绍:分类效果非常好的梯度提升树的一个实现,很多机器学习竞赛的冠军必选包
链接:XGBoost Documents
自然语言处理库
nltk
简单介绍:很好用的自然语言处理库,可以支持斯坦福的各种自然语言处理工具的调用
链接:Natural Language Toolkit
jieba
简单介绍:非常简单易用的中文分词工具
链接:GitHub - fxsjy/jieba: 结巴中文分词
gensim
简单介绍:非常好用的文本模型工具包,word2vec词向量基本上就用这个训练
链接:gensim: Topic modelling for humans
数据库连接库
pymysql
简单介绍:连接mysql的
链接:GitHub - PyMySQL/PyMySQL: Pure Python MySQL Client
theano
简单介绍:非常流行的一个深度学习库,在学术界用的比较多
链接:Welcome — Theano 0.8.2 documentation
简单介绍:对theano和tensorflow的一个高层封装,非常简单易用,十几行代码就可以写一个非常复杂的深度学习网络
链接:Keras Documentation
简单介绍:
链接:https://www.tensorflow.org/
简单介绍:对tensorflow的一个封装,api十分丰富,不过不支持seq2seq的模型是目前的一大遗憾
链接:GitHub - tflearn/tflearn: Deep learning library featuring a higher-level API for TensorFlow.
简单介绍:另一个对tensorflow的封装,这个封装的层次不是特别高,所以自己的可操作性更大一些,目前正在学习中
链接:GitHub - zsdonghao/tensorlayer: TensorLayer: A Deep Learning and Reinforcement Learning Library for TensorFlow.