Рубрики
Без рубрики

Обработка аудио в Python – Введение в Python Librosa

В этой статье мы поговорим об обработке звука в Python. Сегодня я собираюсь обсудить библиотеку обработки аудиосигнализации Python под названием Librosa.

Автор оригинала: Pankaj Kumar.

В этой статье мы поговорим об обработке звука в Python. Давайте расходим немного от наших Обработка натурального языка и текстовые аспекты питона и мл. Сегодня я собираюсь обсудить библиотеку обработки аудиосигнализации Python под названием Либорда Отказ

Что такое libleosa?

Либорда – это пакет Python для анализа музыки и аудио. Он предоставляет строительные блоки, необходимые для конструирования структур для поиска музыкальных знаний.

Обработка аудио в Python

Теперь, когда вы знаете библиотеку, которую мы собираемся использовать для нашей задачи обработки звука, давайте перейдем вперед на работу с библиотекой и обрабатывать аудиофайл MP3.

1. Установка Librosa для обработки аудио в Python

Мы можем легко установить Libresa с помощью команды PIP:

pip install librosa

Давайте загрузимся в короткий mp3-файл (вы можете использовать любой файл MP3 для этой демонстрации):

y, sr = librosa.load('/content/Kids Cheering - Gaming Sound Effect (HD) (128  kbps).mp3')

2. Обработка аудио как временной серии

В вышеуказанной линии функция нагрузки считывает аудио MP3 как временные ряды. Здесь SR обозначает образец_рат.

Если вы хотите переподготовки на временные серии, перейдите сюда: данные о времени и машинное обучение.

  • Временные ряды представлены массивом.
  • Образец – это количество образцов в секунду аудио.

Аудио по умолчанию смешивается с моно. Затем вы отмените его при загрузке до 22050 Гц. Предлагая дополнительные причины для Librosa.load, это действие может быть переопределено.

3. Получить функции аудиофайла

Существуют некоторые важные особенности аудио образца, что мы быстро обсудим:

Существует очень простой фундаментальный ритм в некоторых формах музыкальных узоров, в то время как другие имеют более нюансированные или предполагаемые.

  • Темп : Является ли тем, в котором репликация ваших узоров. Вы измеряете темп в ударах в минуту (BPM). Поэтому, если мы поговорим о музыке, находящейся в 120 BPM, мы говорим, что каждую минуту 120 ударов (импульсы).
  • Бить : Период времени. Это в основном ритм, которому вы будете хлопать в песне. Например, вы получаете четыре удара в баре в 4/4 времени.
  • Бар : Бар – это логический набор ударов. Обычно бары получают 3 или 4 ударов, хотя возможны другие возможности.
  • Шаг : В состав программ я обычно вижу это. Нормально иметь последовательность примечаний, таких как 8 шестнадцатых нот, которые являются всеми одинаковыми длинами. Разница между каждой запиской является движение. Если вы нашли это, вы хотели бы ходить по шестнадцатым нотам. Обычно вы устанавливаете восьмые заметки или триплеты или четверть заметки для вашего движения.
  • Ритм : Это список музыкальных звуков. В заявлении возьмите все заметки, и это ритм.

Мы можем получить темп и бьется из аудио:

tempo, beat_frames = librosa.beat.beat_track(y=y, sr=sr)

4. Коэффициенты частоты Mel Cepstral (MFCC)

Коэффициенты частоты MEL CEPSTRAL – одна из самых важных функций в обработке звука. Это такая тема, поэтому вместо этого, вот Page Wikipedia для вас, чтобы обратиться.

MFCC является матрицей значений, которые захватывают Тембральный Аспекты музыкального инструмента, как о том, как древесные гитары и металлические гитары звучат немного разных. Это не захвачено другими мерами, так как оно наиболее похоже на слушание человека.

mfcc = librosa.feature.mfcc(y=y, sr=sr, hop_length=hop_length, n_mfcc=13)
import seaborn as sns
mfcc_delta = librosa.feature.delta(mfcc)
sns.heatmap(mfcc_delta)

Здесь мы создаем теплообщение с использованием данных MFCC, которые вы можете видеть, дает нам вывод как ниже:

Нормализация MFCC в хромаграм, мы получаем:

chromagram = librosa.feature.chroma_cqt(y=y_harmonic, sr=sr)
sns.heatmap(chromagram)

Я предполагаю, что у вас есть некоторые идеи извлечения извлечения аудиоданных для разных алгоритмов глубокого обучения для активности добычи.

Завершение примечания

Продолжайте следовать нашему обучению машины в учебниках Python. У нас есть гораздо больше, чтобы прийти в ближайшее время. Если вы начинаете в Python и случайно приземлились здесь (вы не будете первыми!) Посмотрите на Учебное пособие на Python для начинающих.