Рубрики
Без рубрики

Импорт данных из Интернета в Python

Импортировка данных из Интернета в Python на протяжении всего поездки в качестве ученого данных, вы w… Помечено Python, Datascity, начинающие.

На протяжении всего путешествия в качестве ученого данных вы будете регулярно иметь дело с данными. Иногда эти данные легко доступны, в то время как в других случаях вы должны исходить и собрать данные самостоятельно.

Ваши данные могут быть собраны из различных источников, но чаще всего вы получите эти данные из сети.

Теперь представьте, что вы нашли сайт, который имеет такие гигантские огромные данные, которые вы найдете очень полезным. К сожалению, вы не можете загрузить содержимое на этом веб-сайте на ваше устройство для анализа.

Вручную составляя данные с сайта, будут стоить вам большое количество времени. К счастью, вы можете беспрепятственно импортировать эти данные, используя некоторые пакеты Python.

Импорт данных с использованием URLRETROVE

  1. Импортировать функцию UrlretRiev от Urllib.request Подппозиция. от Urllib.request Импорт URLRETROVE
  2. Назначьте URL-адрес веб-сайта переменной – «URL» используется в качестве примера здесь.

  3. Используйте функцию UrlretRiev. Чтобы сохранить этот файл локально. Пройдите два аргумента функции – URL-адрес веб-сайта (который был назначен на вариабельный «URL») и имя, которое вы хотите сохранить файл как.

  4. Данные теперь сохраняются как файл на вашем устройстве, который вы можете управлять и Wrangle, как вы хотите.

Импорт данных с помощью URLOPEN и запроса

Чтобы полностью понять, как это работает, вам нужно иметь базовое понимание HTTP-запросов. Но беспокойтесь не, даже если вы не понимаете запросы, вы можете выполнить шаги ниже и импортировать данные из сети.

  1. Импортировать функции Urlopen и Запрос из подпакаса Urllib.request Отказ

  2. Укажите URL.

  3. Пакет запроса, позвонив Запрос на URL.

  4. Отправьте запрос и поймите ответ.

  5. Ответ, полученный из вашего запроса, является объектом. Чтобы извлечь содержание HTML, вызовите метод чтения на объекте ответа.

  6. Затем вы можете печатать, WRANGE и управлять контентом веб-страницы.

Импорт данных с запросами

Тогда вот и всемогущий Запросы упаковка. Это проще и более рекомендуемый способ выполнения одного и того же импорта, выполненный с Урлыб выше.

  1. Импортируйте пакет запроса.

  2. Укажите URL.

  3. Позвоните запросы «Получите метод» на URL. Это пакеты запроса, отправляют его и ловит ответ. Все с одной командой. Довольно круто, верно?

  4. Ответ является объектом HTTP. Чтобы получить доступ к содержимому ответа, вызовите текстовый атрибут на объекте.

Обратите внимание, что есть несколько других действий, которые вы можете взять с использованием упаковок, используемых выше, как взаимодействие с API. Однако для контекста этой статьи мы относимся только к использованию их для импорта данных из веб-страницы.

Woohoo! Теперь вы можете легко импортировать данные из сети с Python. Однако данные импортированы HTML, с тегами HTML и другие атрибуты HTML. Поэтому они не совсем готов к использованию или анализу.

Чтобы сделать их готовыми к использованию, вы должны отформатировать их с помощью пакета под названием BeautifulSoup. Это будет обсуждаться в последующей деятельности.

До этого продолжите импортировать данные с этими пакетами и делать чудеса с Python.

Оригинал: “https://dev.to/olayinkaatobiloye/importing-data-from-the-web-into-python-3h0n”