Рубрики
Без рубрики

Самое простое руководство, чтобы вы начали на компьютерном видении

Добро пожаловать в серию Python AI 🙋🏻♂️ Будьте готовы использовать свой интеллект, чтобы дать жизни машин и … Теги с Python, Computerscience, программированием, AI.

Добро пожаловать в Python Ai Series 🙋🏻♂️. Будьте готовы использовать свой интеллект, чтобы дать жизни машин и разблокировать потенциал внутри 🧠 Я Сай Ашиш И сегодня я здесь, чтобы предоставить вам представление о мире компьютерного видения Без дальнейшего ADO давайте погрузимся в

В этой статье я собираюсь покрыть:

1. Understanding Image Recognition, Image Processing, and Computer Vision
2. Selecting a Programming Language for Computer Vision
3. What Is OpenCV?
4. Basic Program on Computer Vision Using Python

1. Понимание распознавания изображений, обработки изображений и компьютерного зрения

У людей есть глаза, чтобы увидеть изображение, мозг обрабатывать это изображение и распознавать то, на что мы смотрим. В то время как машина может выполнить чудесные подвиги, он не удается с большинством основных задач, выполняемых человеком.

Посмотрите на его объект выше. Что это? Да, это мяч. Но как мы определили, что это изображение было мячом? Или как мы узнаем любой объект?

На очень фундаментальном уровне это через его характеристики. Наш мозг автоматически извлекает особенности того, что мы видим. Посредством опыта и учения мы знаем, что определенный объект классифицируется как мяч, если он является круглым объектом (в основном сферическим). Он имеет трехмерную структуру, симметричную форму, имеет площадь поверхности и объем на основе его радиуса. Он не содержит граней, углов или краев. Но не все сферы – это шары – это может быть глобус или апельсин тоже! Другие характеристики, такие как цвет, текстура, размер, угол и освещение, дают нашему мозгу, дополнительная информация должна идентифицировать мяч.

Вся эта обработка, эти вычисления занимают просто секунду для нашего мозга для выполнения. Это сила человеческого разума. Напротив, машина все еще позади, чтобы догнать эту форму интеллекта. На самом деле, мы только начинаем делать машины, способные распознавать изображения.

Как машины распознают изображения?

Видимо, человеческий видит Изображение через его глаза , процессы изображение через его мозг и общается Используя его рот Отказ

Точно так же мы разработали различные датчики, подобные линзы камеры для Посмотреть Изображение и алгоритмы (пошаговые инструкции по выполнению определенной задачи) для обработки изображения.

Этот процесс распознавания изображений называется Распознавание изображения Отказ Обработка, которую мы делаем, чтобы улучшить качество изображения, называется Обработка изображений Отказ Позвольте компьютерам извлекать полезную информацию с изображения, подражая человеческому зрению и действую на него называется Компьютерное зрение Отказ

Теперь, когда мы ясно в терминологиях, давайте начнем наше путешествие и разблокировать максимальный потенциал компьютерного видения »

2. Выбор языка программирования для компьютерного зрения:

Для этой серии я собираюсь использовать Python, и я рекомендую его, потому что:

. Легко учить: Написание программы в Python – это написание английского языка. Python очень легко учиться, и даже не технические люди могут взять на себя недели.

б. Мощные библиотеки: У Python есть мощные библиотеки (кусочки кодов), которые доступны легко для нашего использования. Представьте его как приготовление магги. У вас уже есть жареная лапша, а кладокер готов. Все, что вам нужно, это смешать ингредиенты и кипятить его в течение двух минут. Так просто!

c. Бесплатно: Python – это язык программирования с открытым исходным кодом, что означает, что оно бесплатно, и каждый может способствовать его коду для улучшения его функциональности. Эта функция время от времени развивает функции Python, которая не является случай на других языках.

3. Что такое openc?

Для компьютерного зрения у нас есть библиотека Python под названием Opencv Отказ OpenCV – это открытый источник, используемый более 9 миллионов человек и финансируется компаниями, такими как Google, Intel и AMD. Более того, вы можете использовать его для коммерческих приложений, не делая свой проект с открытым исходным кодом.

4. Время К коду: загрузка, сохранение и отображение изображения

Вы можете найти все исходный код для этого проекта в My Репозиторий GitHub Отказ

Мы собрали достаточно Intel. Пришло время увидеть некоторые действия!

Чтобы установить OPENCV в вашей системе, вы должны установить Numpy, потому что OpenCV использует его на заднем плане. Мы также установим MATPLOTLIB для функций отображения изображения. Перейдите на свой терминал и введите:

pip install numpy
pip install opencv-python
pip install matplotlib

Это установит необходимые библиотеки в вашу среду.

Давайте напишем основную программу в Python, где мы загружаем файл в нашу среду, сохраните его и отобразите его на экране компьютера.

Первый шаг – импортировать CV2. CV2 – это интерфейс OpenCV, который нам нужно загрузить в нашей среде для доступа к его функциям. Мы делаем это, используя оператор импорта.

# Importing the required library 
import cv2

К загрузить изображение В нашу систему мы используем функцию IMREAD () OPENCV.

Синтаксис IMREAD ():

cv2.imread (путь, флаг)

Параметры:

Путь: адрес, где изображение хранится в

Флаг: Режим, в котором следует прочитать изображение. Его значение по умолчанию является cv2.imread_color, что означает, что он будет читать цветное изображение по умолчанию

Давайте сохраним это изображение в переменной, называемом изображением

# Loading the image
image = cv2.imread("Sample Image.jpg")

Примечание: Если у вас есть изображение в том же месте, что и файл Python, вам не нужно предоставлять полный путь. Если вы хотите использовать изображение, хранящееся в других каталогах, скопируйте путь с именем и расширением и замените его тестовым Image.png. В окнах путь будет выглядеть что-то подобное D: \ Фотографии \ Тестовые Image.png Добавьте дополнительный «\», чтобы Python не относится к нему как эвакуатор. Последний путь выглядит как D: \ Фотографии \ Тестовые Image.png Для Linux и Mac вы можете использовать путь напрямую, так как он появляется на адресной строке.

Обычно мы применяем разные преобразования к изображению и сохраните его. Как мы будем изучать программы обработки изображений в предстоящей статье сегодня, давайте просто сохраним копию изображения Python в том же каталоге.

К Сохранить изображение Мы используем функцию OpenCV Imwrite ().

Синтаксис Imwrite ():

cv2.imwrite (имя файла, изображение)

Параметры:

Имя файла: Имя файла будет сохранено с помощью требуемого расширения, например, jpg, png, jpeg.

Изображение: Изображение, которое должно быть сохранено.

Чтобы сохранить копию изображения, мы использовали:

# Saving a copy of the image
cv2.imwrite("Sample Image Copy.jpg", image)

К Показать изображение мы используем функцию imshow () как,

Синтаксис imshow ():

cv2.imshow (window_name, image)

Параметры:

Window_Name: Имя окна, в котором изображение изображение отображается

Изображение: изображение, которое должно быть отображено.

# Displaying the image
cv2.imshow("Sample Image",image)

Если вы запустите программу на этом этапе, вы заметите, что изображение появляется на секунду и исчезает. Это потому, что мы не поручили Python дать нам время просмотреть изображение. Чтобы просмотреть изображение для определенной продолжительности, мы используем функцию Waitkee ().

Синтаксис Waitkey ():

cv2.waitkey ([задержка])

Параметр:

Задержка: Время в миллисекундах 0 – это особое значение, которое означает «навсегда. ” Если мы используем 0, то изображение будет отображаться на экране навсегда, пока не нажмем ключ или закройте окно.

# Wait and display the window until a key is pressed
cv2.waitKey(0)

Для хорошей практики кодирования мы используем функцию DestryAllWindows (). Это разрушает все открытые окна при выходе из программы.

# destroy all windows
cv2.destroyAllWindows() 

Конечный исходный код выглядит так:

Вы можете прямо скачать весь исходный код из моего Репозиторий GitHub Отказ

Поздравляю! Вы сделали это Вы сделали первый шаг в войти в мир компьютерного видения Сегодня вы поняли концепцию компьютерного видения, терминологии, связанные с ним, выбирая язык программирования, изучая библиотеку OpenCV и увидела его в Action💯

Если вы считаете, что эта статья предоставила вам ценность, разбивайте, что кнопка «Как можно больше», и поделитесь его как можно большему, потому что UPD, у нас есть несколько очень захватывающих сборки, в том числе распознавание лица, обнаружение лица, обнаружение объектов, распознавание эмоций, сканер документов, сканер И гораздо больше🔥 не забудьте подписаться на рассылку на рассылку, чтобы никогда не пропустить другую больную бомбу 💣 до следующего раза, позаботьтесь 🙋🏻♂️

Бонусные идеи Insightful Coder:

Оригинал: “https://dev.to/theinsightfulcoder/the-easiest-guide-to-get-you-started-on-computer-vision-18n1”