Processamento de Áudio com Python

Passo a Passo

Passo 1: Instalação das bibliotecas necessárias

Certifique-se de ter o Python instalado em seu sistema. Em seguida, instale as bibliotecas necessárias usando o pip:

pip install librosa numpy matplotlib

Passo 2: Importando bibliotecas

Crie um novo script Python e importe as bibliotecas necessárias:

import librosa
import librosa.display
import numpy as np
import matplotlib.pyplot as plt

Passo 3: Carregando um arquivo de áudio

Carregue um arquivo de áudio usando a função librosa.load():

audio_path = 'caminho/do/seu/arquivo.wav'
signal, sr = librosa.load(audio_path, sr=None)

Passo 4: Visualizando o sinal de áudio

Você pode usar o matplotlib para visualizar o sinal de áudio:

plt.figure(figsize=(14, 5))
librosa.display.waveshow(signal, sr=sr)
plt.title('Forma de Onda do Áudio')
plt.xlabel('Tempo (s)')
plt.ylabel('Amplitude')
plt.show()

image

Passo 5: Extrair o Mel Spectrogram

Calcule e exiba o Mel Spectrogram:

mel_spectrogram = librosa.feature.melspectrogram(y=signal, sr=sr, n_fft=2048, hop_length=1024, n_mels=128)
mel_spectrogram_db = librosa.power_to_db(mel_spectrogram, ref=np.max)

plt.figure(figsize=(14, 5))
librosa.display.specshow(mel_spectrogram_db, sr=sr, x_axis='time', y_axis='mel')
plt.colorbar(format='%+2.0f dB')
plt.title('Mel Spectrogram')
plt.show()

image

Passo 6: Extrair os MFCCs

Calcule e exiba os MFCCs:

mfccs = librosa.feature.mfcc(y=signal, sr=sr, n_mfcc=13, hop_length=1024)

plt.figure(figsize=(14, 5))
librosa.display.specshow(mfccs, x_axis='time')
plt.colorbar()
plt.title('MFCCs')
plt.show()

image

Este é um tutorial básico para começar com o processamento de áudio usando Python e LibRosa. Você pode ajustar os parâmetros de acordo com suas necessidades e explorar outras funcionalidades da biblioteca LibRosa para análise de áudio mais avançada. Lembre-se de substituir ‘caminho/do/seu/arquivo.wav’ pelo caminho real do seu arquivo de áudio.