Рубрики
Без рубрики

Parse/Read Xml документ в Python

XML представляет собой расширяемый язык разметки и, как HTML, это также язык разметки. В XML, в … Tagged с Python, XML, Parse, Minidom.

XML представляет собой расширяемый язык разметки и, как HTML, это также язык разметки. В XML в любом случае мы не используем предопределенные метки, однако здесь мы можем использовать наши собственные метки, зависящие от информации, которую мы откладываем в записи XML.

Запись XML часто используется для обмена, хранения и проектирования информации, поскольку она может быть перемещена без особого отрезка между серверами и рамками. В целом мы знаем в отношении информации, Python является одним из самых выдающихся языков программирования, чтобы измерить и разобрать ее.

К счастью, Python сопровождает стандартный XML -модуль, который может анализировать записи XML в Python и, кроме того, составлять информацию в документе XML. Это называется Python XML -анализатор.

В этом Учебник Python XML , мы прогуляемся по модулям Minidom и Elemetntree Python XML и выясним, как проанализировать документ XML в Python.

Читать XML документ на Python с помощью Minidom

Minidom является подмодулем стандартного XML -модуля Python, что означает, что вам не нужно устанавливать XML для использования Minidom.

Модуль Minidom анализирует документ XML в модели объекта документа (DOM), данные которой можно дополнительно извлечь с помощью функции getElemetsBytagName ().

Синтаксис:

from xml.dom import minidom

minidom.parse("filename")

Пример:

Давайте возьмем все имена и данные телефона из нашего файла demo.xml.

from xml.dom import minidom


#parse xml file
file = minidom.parse('demo.xml')

#grab all  tags
records = file.getElementsByTagName("record")

print("Name------>Phone")

for record in records:
    #access  and  node of every record
    name = record.getElementsByTagName("name")
    phone = record.getElementsByTagName("phone")

    #access data of name and phone
    print(name[0].firstChild.data, end="----->")
    print(phone[0].firstChild.data)

Выход

Name------>Phone
Jameson----->(080) 78168241
Colton----->(026) 53458662
Dillon----->(051) 96790901
Channing----->(014) 98829753

Затем мы анализируем наш файл demo.xml с помощью. Функция parse () анализирует документ XML в объекте узла модели с корневым узлом.

Примечание: «Наш сценарий Python и файл Demo.xml расположены в том же месте, почему мы только указываем имя файла demo.txtin функцию minidom.parse (). Если ваш сценарий Python и XML -файл расположены в разных местах, то вам нужно указать абсолютный или относительный путь файла ».

После прохождения файла XML в нашей программе Python мы получили доступ ко всем узлам, используя оператор.

GetElementsbytagname () – это функция объекта Minidom, которая возвращает объекты узла указанного тега.

Как только у нас появились все узлы записей, мы пробираемся через эти узлы, и снова используя функцию getElementsbytagname (), мы обратились к его вложенным и узлам.

Далее, после доступа к отдельному имени и узлу телефонного узла мы напечатали их данные, используя имя [0] .firstchild.data и телефон [0] .firstchild.datastatement.

FirstChild.Datais свойства каждого узла, с помощью которого мы можем получить доступ к текстовым данным конкретного объекта узла.

Вывод

Это суммирует это учебное упражнение на анализаторе Python XML. Как должно быть очевидно, Python дает стандартный модуль XML -модуля для просмотра и анализ записей XML в Python. Это в целом имеет 2 подмодуля, которые могут проанализировать XML -документ:

  • Минидом и

  • ElementTree

Модуль Minidom следует за моделью объекта документа, чтобы справиться с Parse A XML -записью. Опять же, модуль ElementTree следует за деревьями, похожей на конструкцию, чтобы разобрать документ XML.

Оригинал: “https://dev.to/cloudytech147/parse-read-xml-document-in-python-94l”