Автор оригинала: Team Python Pool.
Numpy Count | Практическое объяснение поиска вхождений
Numpy-один из лучших и наиболее широко используемых модулей.Потому что это делает вычисления легкими и простыми с более высокой скоростью. Аналогично, у нас есть numpy count, метод поиска вхождения подстроки в заданном массиве или списке. Это легко использовать, и просто работает. Но, как и у Numpy, закулисные вещи сложны.
Что такое Numpy Count?
Фактическая функция-num.char.count(). Поэтому синтаксис немного меняется. Но работа функции остается прежней: найти количество вхождений той или иной строки. Это тоже из заданного списка слов без перекрытия вхождения в каждое слово списка.
Синтаксис Numpy Count
Ниже приведен синтаксис использования функции numpy count:
numpy.core.defchararray.count(arr, substring,,)
В то время как обычный способ написания его таков:
np.char.count(array, substring)
Параметры Numpy Count
Параметр | Обязательно или Нет |
арр | Обязательный |
подстрока | Обязательный |
начало | необязательный |
конец | необязательный |
arr: массив
ошибка (массив) – это основа нашей функции. Потому что этот параметр предоставляет список строк. Хотя это и массив, он легко пересекается функцией. И подсчет производится для каждой строки отдельно. Используемый тип данных-либо массивоподобный, либо только строковый.
подстрока
подстрока указывает комбинацию символов, которые должны быть найдены в предоставленном массиве. То есть он обязательно должен быть использован. Функция рассматривает все символы как один. Так становится легче переходить и считать. Используемый тип данных должен быть str или Unicode.
начало/конец
Они определяют границы поиска. Потому что это позиции поиска в строке. Они необязательны в использовании и обычно не используются. У них есть тип данных int. Начало и конец оба используются индивидуально в соответствии с требованиями. В то время как позиция к концу не включена, начало включено. Ограничения, которые они устанавливают, существуют для каждой строки независимо от других.
Возвращаемое значение
Согласно href=”https://numpy.org/doc/stable/reference/generated/numpy.char.count.html?highlight=numpy%20count#numpy.char.count”>numpy.org, Эта функция возвращает массив. Который содержит количество неперекрывающихся вхождений подстроки sub в диапазоне [start, end]. Другими словами, целочисленный массив с числом неперекрывающихся вхождений подстроки. href=”https://numpy.org/doc/stable/reference/generated/numpy.char.count.html?highlight=numpy%20count#numpy.char.count”>numpy.org, Эта функция возвращает массив. Который содержит количество неперекрывающихся вхождений подстроки sub в диапазоне [start, end]. Другими словами, целочисленный массив с числом неперекрывающихся вхождений подстроки.
Примеры Numpy Count
Прежде чем мы начнем кодировать, нам нужно импортировать модуль – numpy:
import numpy as np
Теперь мы готовы к кодированию. Итак, мы создаем массив:
Теперь мы используем эту функцию на нем:
np.char.count(arr,'hhe') array([1, 1, 1, 1]) np.char.count(arr,'ab') array([0, 0, 1, 0])
Здесь мы искали две разные подстроки без определения границ. И результат показывает работу. Есть четыре строки, и в каждой мы имеем "the" только один раз. В то время как было больше "н", он рассматривал только объединенные. То же самое относится и ко второму примеру: "ав" встречается вместе дважды. Но только один раз "б" после "а".
np.char.count(arr,'h',2) array([1, 2, 0, 2])) array([0, 0, 1, 1])) array([1, 0, 0, 1]) np.char.count(arr,'a',3,7) array([0, 0, 1, 0])) array([0, 1, 0, 2])
Здесь вы можете увидеть, что начало и конец могут быть использованы индивидуально. И даже не используя слова начало и конец, мы можем распределить позиции.
Str.count vs Numpy Count
Count используется еще одним способом в базовом python как string.count(). Согласно W3schools, метод возвращает количество раз, когда указанное значение появляется в строке. Это похоже на numpy count, но немного отличается.
arr.count('hh') Traceback (most recent call last): File "", line 1, in AttributeError: 'numpy.ndarray' object has no attribute 'count' a.count('pla') 1 a.count('o') 4
Если мы используем count напрямую, это дает ошибку трассировки. Потому что 'arr'-это N-мерный массив с несколькими строковыми массивами. В то время как если мы используем простую строку типа "а", это дает аналогичные результаты. Таким образом, в numpy функция count вызывается для каждой строки отдельно, а rest-то же самое
Если мы используем count напрямую, это дает ошибку трассировки. Потому что 'arr'-это N-мерный массив с несколькими строковыми массивами. В то время как если мы используем простую строку типа "а", это дает аналогичные результаты. Таким образом, в numpy функция count вызывается для каждой строки отдельно, а rest-то же самое
Когда вы ищете numpy count, вы также можете получить эту функцию. Это подсчитывает количество ненулевых значений в массиве a. С синтаксисом: numpy.count_nonzero(a,, *,)
Он подсчитывает количество ненулевых значений в N-мерном массиве. Без оси он говорит для всего массива. С помощью axis он сообщает результаты в виде строки или столбца.
Что Дальше?
NumPy очень мощен и невероятно важен для информатики в Python. Это правда, если вы интересуетесь наукой о данных в Python, вам действительно следует узнать больше о Python.
Возможно, вам понравятся наши следующие учебники по numpy.
- Среднее значение: Реализация и важность
- Использование случайной функции для создания случайных данных
- Reshape: Изменение Формы Массивов С Легкостью
- Углубленное объяснение np.power() С Примерами
- Функция Зажима
Вывод
В заключение можно сказать, что numpy count широко используется и легко понимается. Таким образом, каждый может использовать его с комфортом и сделать вычисления проще.
Все еще есть какие-либо сомнения или вопросы, дайте мне знать в разделе комментариев ниже. Я постараюсь помочь вам как можно скорее.
Счастливого Пифонирования!