最常用的九个Python库用于机器学习

　　发布于2024-11-22　阅读（0）

扫一扫，手机访问

机器学习最常用的9个Python库

机器学习是一种编程技术，让计算机能够从多种数据中自动学习。过去，开发人员需要手动编写算法来进行机器学习任务。而现在，使用各种Python库，我们能够更高效地完成机器学习任务。这种技术的发展使得机器学习变得更加普遍和易于实施。

机器学习中使用的Python库

Numpy

NumPy是一个强大的Python库，专门用于处理大型多维数组和矩阵。它提供了丰富的高级数学函数，非常适用于机器学习中的基础计算。其中包括线性代数、傅里叶变换和随机数功能等等。

相应代码

import numpy as np
x=np.array([[1,2],[3,4]])
y=np.array([[5,6],[7,8]])
v=np.array([9,10])
w=np.array([11,12])
print(np.dot(v,w),"\n")
print(np.dot(x,v),"\n")
print(np.dot(x,y))

Scipy

SciPy在机器学习爱好者中非常受欢迎，因为它包含优化、线性代数、集成和统计等模块，SciPy对于图像处理也非常有用。

SciPy库和SciPy堆栈之间存在差异，SciPy是构成SciPy堆栈的核心包之一。

from scipy.misc import imread,imsave,imresize
img=imread('D:/Programs/cat.jpg')#path of the image
print(img.dtype,img.shape)
img_tint=img*[1,0.45,0.3]
imsave('D:/Programs/cat_tinted.jpg',img_tint)
img_tint_resize=imresize(img_tint,(300,300))
imsave('D:/Programs/cat_tinted_resized.jpg',img_tint_resize)

Scikit-learn

Scikit-learn是用于经典ML算法库之一。它是基于NumPy和SciPy库建立的。Scikit-learn支持大多数有监督和无监督学习算法。Scikit-learn还可用于数据挖掘和数据分析。

from sklearn import datasets
from sklearn import metrics
from sklearn.tree import DecisionTreeClassifier
dataset=datasets.load_iris()
model=DecisionTreeClassifier()
model.fit(dataset.data,dataset.target)
print(model)
expected=dataset.target
predicted=model.predict(dataset.data)
print(metrics.classification_report(expected,predicted))
print(metrics.confusion_matrix(expected,predicted))

Theano

机器学习基本上是数学和统计学。Theano是一个流行的Python库，以有效的方式定义、评估和优化涉及多维数组的数学表达式。它是通过优化CPU和GPU的利用率来实现的。它广泛用于单元测试和自我验证，以检测和诊断不同类型的错误。

Theano是一个非常强大的库，无论是大规模计算密集型科学项目，还是个人都能被应用到项目中。

import theano
import theano.tensor as T
x=T.dmatrix('x')
s=1/(1+T.exp(-x))
logistic=theano.function([x],s)
logistic([[0,1],[-1,-2]])

TensorFlow

TensorFlow是一个非常流行的高性能数值计算开源库，由谷歌的Google Brain团队开发。顾名思义，Tensorflow是一个涉及定义和运行涉及张量的计算的框架。它可以训练和运行可用于开发多个AI应用程序的深度神经网络。TensorFlow广泛应用于深度学习研究和应用领域。

import tensorflow as tf
x1=tf.constant([1,2,3,4])
x2=tf.constant([5,6,7,8])
result=tf.multiply(x1,x2)
sess=tf.Session()
print(sess.run(result))
sess.close()

Keras

Keras是一个非常流行的Python机器学习库。提供了许多用于探索、组合和过滤数据的内置方法。能够在TensorFlow、CNTK或Theano之上运行。它可以在CPU和GPU上无缝运行。

Keras的优点之一是它可以轻松快速地进行原型设计。Keras让ML初学者真正能够构建和设计神经网络。

PyTorch

PyTorch是一个流行的基于Torch的Python开源机器学习库，用C语言实现，并在Lua中封装。它有很多工具和库可供选择，支持计算机视觉、自然语言处理(NLP)和更多ML程序。它允许开发人员使用GPU加速对张量执行计算，还有助于创建计算图。

import torch
dtype=torch.float
device=torch.device("cpu")
N,D_in,H,D_out=64,1000,100,10
x=torch.random(N,D_in,device=device,dtype=dtype)
y=torch.random(N,D_out,device=device,dtype=dtype)
w1=torch.random(D_in,H,device=device,dtype=dtype)
w2=torch.random(H,D_out,device=device,dtype=dtype)
learning_rate=1e-6
for t in range(500):
h=x.mm(w1)
h_relu=h.clamp(min=0)
y_pred=h_relu.mm(w2)
loss=(y_pred-y).pow(2).sum().item()
print(t,loss)
grad_y_pred=2.0*(y_pred-y)
grad_w2=h_relu.t().mm(grad_y_pred)
grad_h_relu=grad_y_pred.mm(w2.t())
grad_h=grad_h_relu.clone()
grad_h[h&lt;0]=0
grad_w1=x.t().mm(grad_h)
w1-=learning_rate*grad_w1
w2-=learning_rate*grad_w2

Pandas

Pandas是一个流行的Python数据分析库。它与机器学习没有直接关系。众所周知，数据集必须在训练前准备好。在这种情况下，Pandas就派上用场了，因为它是专门为数据提取和准备而开发的。它为数据分析提供了高级数据结构和各种工具。它提供了许多用于分组、组合和过滤数据的内置方法。

import pandas as pd
data={"country":["Brazil","Russia","India","China","South Africa"],
"capital":["Brasilia","Moscow","New Delhi","Beijing","Pretoria"],
"area":[8.516,17.10,3.286,9.597,1.221],
"population":[200.4,143.5,1252,1357,52.98]}
data_table=pd.DataFrame(data)
print(data_table)

Matplotlib

Matplotlib是一个非常流行的用于数据可视化的Python库。和Pandas一样，它与机器学习没有直接关系。

但它在可视化方面非常有用，作为2D绘图库，可以创建2D图形和绘图，提供了控制线条样式、字体属性、格式化轴等的功能。

用于数据可视化的各种图形和绘图，即直方图、错误图表、条形聊天等均可以通过Matplotlib实现。

import matplotlib.pyplot as plt
import numpy as np
x=np.linspace(0,10,100)
plt.plot(x,x,label='linear')
plt.legend()
plt.show()

本文转载于：https://fuxi.163.com/database/113 如有侵犯，请联系admin@zhengruan.com删除

上一篇：电脑杀毒软件哪个最佳？

下一篇：寻找一个可用的发型设计软件

产品推荐

售后无忧
立即购买>

DAEMON Tools Lite 10【序列号终身授权 + 中文版 + Win】

￥150.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Ultra 5【序列号终身授权 + 中文版 + Win】

￥198.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Pro 8【序列号终身授权 + 中文版 + Win】

￥189.00
office旗舰店
售后无忧
立即购买>

CorelDRAW X8 简体中文【标准版 + Win】

￥1788.00
office旗舰店

正版软件

加密货币到底有什么价值

加密货币的价值基于其稀缺性、安全性、对冲通胀的能力、交易效率、分散化以及投机潜力。

5分钟前 0
正版软件

加密货币交易所app

加密货币交易所应用程序是移动软件，允许用户买卖和管理加密货币，提供便捷性、安全性、货币多样性、实时数据和移动警报功能。在选择应用时，需考虑货币支持、安全措施、费用、用户界面和客户支持等因素。使用时需选择信誉良好的应用，启用安全功能，谨慎交易，存储少量加密货币并跟踪交易。

15分钟前 0
正版软件

2025年狗狗币能涨多少

2025年狗狗币价格预测在0.2至1美元之间，具体取决于社区增长、名人代言和可用性等因素；然而，波动性、监管和竞争也可能导致价格下跌。

30分钟前 0
正版软件

苹果终止FineWoven生产，新材质或将亮相iPhone 16发布会

近日消息，4月22日消费者已经获悉，苹果已经秘密地终止了FineWoven（精织斜纹）这种材质的生产，这似乎意味着这款曾备受瞩目的配件素材将逐步退出历史舞台。FineWoven是2023年9月随着iPhone15系列的发布而首次亮相的。当时，苹果希望这种新型材质能够够取代传统的皮革素材，为用户提供全新的触感和使用体验。但市场反馈显示，FineWoven在耐用性和抗污能力上的不足，成为了消费者批评的焦点。经过小编了解，苹果内部已经认识到FineWoven并不是一个成功的皮革代替品，并已做出决策，停止了这种材

45分钟前苹果 0
正版软件

“递归符文”要来了？

作者：Cookie，律动今天凌晨，比特币NFT项目Blob的联合创始人，也是Ordinals协议当前排名第6的贡献者，@Elocremarc，发布了这样一条推文：“时候到了，递归符文！”在小编写这篇文章的时候，Blob的地板价已经应声上涨了30%，突破了0.04比特币。所以，“递归”我们知道，“符文”我们也知道，“递归符文”又是个啥？让铭文跟着符文一起“动起来”“递归”的作用大家应该都有所了解，“链上指针”，可以让铭文引用比特币链上数据，包括其它铭文的数据。支持引用的数据有以下这些，包括最新区块高度、指定

1小时前 05:25 0