- 机器学习:Python实践
- 魏贞原
- 414字
- 2020-12-22 16:30:38
2.2 SciPy
SciPy是在数学运算、科学和工程学方面被广泛应用的Python类库。它包括统计、优化、整合、线性代数模块、傅里叶变换、信号和图像处理、常微分方程求解器等,因此被广泛地应用在机器学习项目中。SciPy依赖以下几个与机器学习相关的类库。
NumPy:是Python的一种开源数值计算扩展。它可用来存储和处理大型矩阵,提供了许多高级的数值编程工具,如矩阵数据类型、矢量处理、精密的运算库。
Matplotlib:Python中最著名的2D绘图库,十分适合交互式地进行制图;也可以方便地将它作为绘图控件,嵌入GUI应用程序中。
Pandas:是基于NumPy的一种工具,是为了解决数据分析任务而创建的。Pandas纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具,也提供了大量能使我们快速、便捷地处理数据的函数和方法。
安装并熟悉SciPy是提高机器学习实践的有效手段,尤其是在以下几个方面:
可以利用NumPy数组来准备机器学习算法的数据。
可以使用Matplotlib来创建图表,展示数据。
通过Pandas导入、展示数据,以便增强对数据的理解和数据清洗、转换等工作。