Классификация изображений с помощью Python и TensorFlow: начиная с Scratch

Классификация изображений с помощью Python и TensorFlow: начинаем с нуля

2024-07-12

введение

Классификация изображений — основная задача компьютерного зрения, которая позволяет компьютерам автоматически идентифицировать объекты на изображениях. В этой статье мы будем использовать Python и TensorFlow для реализации простой модели классификации изображений, которая поможет каждому понять основы технологии искусственного интеллекта.

Подготовка

Во-первых, нам нужно установить некоторые необходимые библиотеки Python. Откройте терминал командной строки и выполните следующую команду:

pip install tensorflow numpy matplotlib

Загрузить набор данных

Мы будем использовать знаменитый набор данных MNIST, который содержит изображения рукописных цифр (от 0 до 9). В TensorFlow уже встроен этот набор данных, поэтому мы можем легко его загрузить.


import tensorflow as tf
from tensorflow.keras.datasets import mnist
 
# 加载MNIST数据集
(x_train, y_train), (x_test, y_test) = mnist.load_data()
 
# 归一化图像数据
x_train, x_test = x_train / 255.0, x_test / 255.0

Построить модель

Мы будем использовать простую модель нейронной сети для классификации изображений. Эта модель содержит входной слой (слой Flatten), два полностью связанных слоя (плотный слой) и выходной слой.


from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Flatten
 
# 构建顺序模型
model = Sequential([
    Flatten(input_shape=(28, 28)),  # 输入层：将28x28的图像展平成一维数组
    Dense(128, activation='relu'),  # 隐藏层：128个神经元，使用ReLU激活函数
    Dense(10, activation='softmax') # 输出层：10个神经元，使用Softmax激活函数
])
 
# 编译模型
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

Модель обучения

Теперь мы можем обучить модель. Мы будем использовать данные обучения (x_train, y_train) для обучения модели и тестовые данные (x_test, y_test) для оценки производительности модели.


# 训练模型
model.fit(x_train, y_train, epochs=5)
 
# 评估模型
test_loss, test_acc = model.evaluate(x_test, y_test)
print('测试准确率:', test_acc)

предсказанное изображение

После завершения обучения мы можем использовать модель для прогнозирования новых изображений. Вот как можно сделать прогноз по изображению на основе тестовых данных.


import numpy as np
import matplotlib.pyplot as plt
 
# 选择一张测试图像
img = x_test[0]
plt.imshow(img, cmap='gray')
plt.show()
 
# 预测图像类别
img = np.expand_dims(img, 0)  # 扩展维度以匹配模型输入
predictions = model.predict(img)
predicted_class = np.argmax(predictions)
print('预测类别:', predicted_class)

Подведем итог

В этой статье мы начали с нуля и реализовали простую модель классификации изображений, используя Python и TensorFlow. На этом примере мы научились загружать данные, строить модель, обучать ее и делать прогнозы. Я надеюсь, что эта статья поможет вам начать работу с технологией искусственного интеллекта и вдохновит вас на дальнейшие исследования в этой области.

В этой статье рассказывается, как реализовать простую модель классификации изображений с использованием Python и TensorFlow, а также приводятся подробные примеры кода, которые помогут вам выполнить эту задачу шаг за шагом. В настоящее время Python также очень популярен. Конечно, автор не может перестать двигаться вперед. Это правда, что он использует передовые технологии. Языки все одинаковые, просто выучите их!

Обмен технологиями