XML представляет собой расширяемый язык разметки и, как HTML, это также язык разметки. В XML в любом случае мы не используем предопределенные метки, однако здесь мы можем использовать наши собственные метки, зависящие от информации, которую мы откладываем в записи XML.
Запись XML часто используется для обмена, хранения и проектирования информации, поскольку она может быть перемещена без особого отрезка между серверами и рамками. В целом мы знаем в отношении информации, Python является одним из самых выдающихся языков программирования, чтобы измерить и разобрать ее.
К счастью, Python сопровождает стандартный XML -модуль, который может анализировать записи XML в Python и, кроме того, составлять информацию в документе XML. Это называется Python XML -анализатор.
В этом Учебник Python XML , мы прогуляемся по модулям Minidom и Elemetntree Python XML и выясним, как проанализировать документ XML в Python.
Читать XML документ на Python с помощью Minidom
Minidom является подмодулем стандартного XML -модуля Python, что означает, что вам не нужно устанавливать XML для использования Minidom.
Модуль Minidom анализирует документ XML в модели объекта документа (DOM), данные которой можно дополнительно извлечь с помощью функции getElemetsBytagName ().
Синтаксис:
from xml.dom import minidom minidom.parse("filename")
Пример:
Давайте возьмем все имена и данные телефона из нашего файла demo.xml.
from xml.dom import minidom #parse xml file file = minidom.parse('demo.xml') #grab alltags records = file.getElementsByTagName("record") print("Name------>Phone") for record in records: #access and node of every record name = record.getElementsByTagName("name") phone = record.getElementsByTagName("phone") #access data of name and phone print(name[0].firstChild.data, end="----->") print(phone[0].firstChild.data)
Выход
Name------>Phone Jameson----->(080) 78168241 Colton----->(026) 53458662 Dillon----->(051) 96790901 Channing----->(014) 98829753
Затем мы анализируем наш файл demo.xml с помощью. Функция parse () анализирует документ XML в объекте узла модели с корневым узлом.
Примечание: «Наш сценарий Python и файл Demo.xml расположены в том же месте, почему мы только указываем имя файла demo.txtin функцию minidom.parse (). Если ваш сценарий Python и XML -файл расположены в разных местах, то вам нужно указать абсолютный или относительный путь файла ».
После прохождения файла XML в нашей программе Python мы получили доступ ко всем узлам, используя оператор.
GetElementsbytagname () – это функция объекта Minidom, которая возвращает объекты узла указанного тега.
Как только у нас появились все узлы записей, мы пробираемся через эти узлы, и снова используя функцию getElementsbytagname (), мы обратились к его вложенным и узлам.
Далее, после доступа к отдельному имени и узлу телефонного узла мы напечатали их данные, используя имя [0] .firstchild.data и телефон [0] .firstchild.datastatement.
FirstChild.Datais свойства каждого узла, с помощью которого мы можем получить доступ к текстовым данным конкретного объекта узла.
Вывод
Это суммирует это учебное упражнение на анализаторе Python XML. Как должно быть очевидно, Python дает стандартный модуль XML -модуля для просмотра и анализ записей XML в Python. Это в целом имеет 2 подмодуля, которые могут проанализировать XML -документ:
Минидом и
ElementTree
Модуль Minidom следует за моделью объекта документа, чтобы справиться с Parse A XML -записью. Опять же, модуль ElementTree следует за деревьями, похожей на конструкцию, чтобы разобрать документ XML.
Оригинал: “https://dev.to/cloudytech147/parse-read-xml-document-in-python-94l”