Автор оригинала: Pankaj Kumar.
Здравствуйте, читатели! В этой статье мы будем сосредоточиться на разных Способы извлечения символов из буквенно-цифровой строки Python в деталях.
Итак, давайте начнем!
Перед темным погружением глубоко в техниках я хотел бы привлечь ваше внимание на простой вопрос, что многие из наших читателей могут иметь, пока они сталкиваются с этой статьей, то есть
Когда вам нужны эти методы, чтобы отделить символы из буквенно-цифровой строки?
Подожди! Не волнуйся 🙂 Ваш вопрос ответили бы сразу ..
Итак, вы видите, когда мы получаем данные для анализа из различных источников, таких как веб-соскабливание, опросы, исторические записи и т. Д. Когда мы понимаем, что данные выделяются в формате RAW.
Перед анализом данных нам нужно очистить и предварительно обработать его. Таким образом, нам могут понадобиться эти методы, чтобы получить только символы из буквенно-цифровой строки соответственно.
Теперь, давайте начнем с объяснения методик в разделе ниже.
1. Метод Python Isalpha () для извлечения символов из буквенно-цифровой строки
Python предоставляет нам string.isalpha ()
Способ обнаружения наличия символов в буквенно-цифровой строке.
Способ ISALPHA () проверяет наличие алфавитов (ниже, а также верхний регистр) в строке и возвращает True только в том случае, если она сталкивается с одним из них, по меньшей мере, один символ.
Синтаксис:
string.isalpha()
Пример:
import re str1 = "7953abcd[)12!zfee" print ("Original alphanumeric string : ", str1) char = "" for x in str1: if x.isalpha(): char = "".join([char, x]) print ("Extracted characters from the alphanumeric string: ", str(char))
В приведенном выше примере мы имеем итерацию каждого символа буквенно-цифровой строки с использованием контура для цикла. Кроме того, мы проверили наличие алфавитов с использованием метода ISALPHA (). Как только будет обнаружен алфавит, он добавляется в созданную строковую переменную «CHAR».
Выход:
Original alphanumeric string : 7953abcd[)12!zfee Extracted characters from the alphanumeric string: abcdzfee
2. Библиотека Python Regex для извлечения только символов из буквенно-цифровой строки
Библиотека Python Regex Позволяет нам обнаружить любой настроенный или определенный регулярное выражение от входной строки.
Кроме того, мы используем re.split () Функция
который разделяет строку только тогда, когда она сталкивается с любым видом шаблона регулярного выражения, передаваемой на нее в качестве параметра.
Наконец, мы добавляем извлеченные символы в строковую переменную, используя метод join (), как показано ниже-
Пример:
import re str1 = "7953abcd[)12!zfee" print ("Original alphanumeric string : ", str1) char = "".join(re.split("[^a-zA-Z]*", str1)) print ("Extracted characters from the alphanumeric string: ", str(char))
Выход:
Original alphanumeric string : 7953abcd[)12!zfee Extracted characters from the alphanumeric string: abcdzfee
3. Использование функции Python Re.findall () для вытягивания символов из буквенно-цифровой строки
Функция Python Re.findall () позволяет нам обнаружить все алфавиты из алфавита из буквенно-цифровой строки.
Re.findall () Функция
Принимает регулярное выражение (шаблон), а также строку, которая будет искать как входные параметры. Затем он возвращает все шаблоны сопоставления из входной строки, как показано ниже.
Пример:
import re str1 = "7953abcd[)12!zfee" print ("Original alphanumeric string : ", str1) char = "".join(re.findall("[a-zA-Z]+", str1)) print ("Extracted characters from the alphanumeric string: ", str(char))
Выход:
Original alphanumeric string : 7953abcd[)12!zfee Extracted characters from the alphanumeric string: abcdzfee
Заключение
По этому, мы подошли к концу этой темы. Не стесняйтесь комментировать ниже, если вы столкнетесь с любым вопросом.
Для большего количества таких постов, связанных с Python, оставаться настроек @ Python с JournalDev и до тех пор, пока
Счастливое обучение !! 🙂.