Рубрики
Без рубрики

DataSet Mnist в Python – Базовый импорт и построение

Добро пожаловать в этот учебник на DataSet Mnist. В этом руководстве мы узнаем, что является набор данных Mnist, как импортировать его в Python и как это построить

Автор оригинала: Pankaj Kumar.

Добро пожаловать в этот учебник на DataSet Mnist. В этом уроке мы узнаем, что такое DataSet Mnist, как импортировать его в Python и как построить его с помощью MATPLOTLIB.

Какой набор данных Mnist?

Mnist Set – большая коллекция Рукописные цифры. Это очень популярный набор данных в области обработки изображений. Часто используется для сравнительных алгоритмов обучения машины.

Мнист это коротко для Модифицированный Национальный институт стандартов и базы данных технологий.

Mnist содержит коллекцию 70 000, 28 х 28 Изображения рукописных цифр от От 0 до 9.

Набор данных уже разделен на наборы обучения и тестирования. Мы увидим это позже в руководстве.

Для получения дополнительной информации о Mnist, обратитесь к его Page Wikipedia Отказ Мы собираемся импортировать набор данных из KERAS.

Давайте начнем с загрузки набора данных в нашу ноутбук Python.

Загрузка мниста из кера

Сначала мы должны импортировать набор данных Mnist из модуля KERAS.

Мы можем сделать это, используя следующую строку кода:

from keras.datasets import mnist

Теперь мы загрузим обучение и тестирование на отдельные переменные.

(train_X, train_y), (test_X, test_y) = mnist.load_data()

Давайте узнаем, сколько изображений в наборах тренировки и тестирования. Другими словами, давайте попробуем выяснить расщепленное соотношение этого набора данных.

Чтобы узнать больше о разделении соотношения, обратитесь к этому руководству о том, как разделить данные на наборы обучения и тестирования.

Чтобы найти раскол соотношения, мы собираемся распечатать формы всех векторов.

print('X_train: ' + str(train_X.shape))
print('Y_train: ' + str(train_y.shape))
print('X_test:  '  + str(test_X.shape))
print('Y_test:  '  + str(test_y.shape))

Выход:

X_train: (60000, 28, 28)
Y_train: (60000,)
X_test:  (10000, 28, 28)
Y_test:  (10000,)

Мы можем видеть, что есть 60k изображения в тренировке и 10k изображений в наборе тестирования.

Размер нашего тренировочного вектора – (60000, 28, 28) это потому, что есть 60 000 изображений в оттенках серого с измерением 28х28.

Заполните код для загрузки набора данных Mnist

Вот полный код из этого раздела:

from keras.datasets import mnist

#loading the dataset
(train_X, train_y), (test_X, test_y) = mnist.load_data()

#printing the shapes of the vectors 
print('X_train: ' + str(train_X.shape))
print('Y_train: ' + str(train_y.shape))
print('X_test:  '  + str(test_X.shape))
print('Y_test:  '  + str(test_y.shape))

Давайте узнаем, как построить этот набор данных.

Построение данных Mnist с использованием MATPLOTLIB

Всегда хорошая идея, чтобы построить набор данных, над которым вы работаете. Он даст вам хорошее представление о том, что вы имеете дело.

Как ответственный ученый с данными, должен быть ваш долг всегда настроить набор данных в качестве ноль шага.

Чтобы построить набор данных, используйте следующий кусок кода:

from matplotlib import pyplot
for i in range(9):  
pyplot.subplot(330 + 1 + i)
pyplot.imshow(train_X[i], cmap=pyplot.get_cmap('gray'))
pyplot.show()

Выход:

Вот как выглядит наши данные!

Представьте себе 70 000 изображений, как эти. Вот что находится внутри набора данных. Быть таким объемным, является одной из причин популярности набора данных.

Проблема распознавания почерков независимо от того, насколько тривиальный устарел сейчас. Была необходимость более сложной версии набора данных MNSIT, который может выступать в качестве его замены.

Есть ли более сложная версия DataSet Mnist?

Да, есть. Модный Мнист набор данных.

Мода Mnist Dataset

Модный набор данных Mnist – это более сложная замена для старого набора данных Mnist.

Этот набор данных содержит 70 000 Небольшая площадь 28 × 28 пикселей оттенков серогосетки предметов 10 видов одежды, таких как обувь, футболки, платья и многое другое.

Чтобы узнать, как импортировать и построить набор данных Mnist моды, прочитайте это руководство.

Заключение

В этом руководстве было опорно и построение набора данных Mnist в Python. Мы также обсудили более сложный замену этого набора данных, модного Mnist Set. Надеюсь, вы веселились с нами!