Passo a Passo
Passo 1: Instalação das bibliotecas necessárias
Certifique-se de ter o Python instalado em seu sistema. Em seguida, instale as bibliotecas necessárias usando o pip:
pip install librosa numpy matplotlib
Passo 2: Importando bibliotecas
Crie um novo script Python e importe as bibliotecas necessárias:
import librosa
import librosa.display
import numpy as np
import matplotlib.pyplot as plt
Passo 3: Carregando um arquivo de áudio
Carregue um arquivo de áudio usando a função librosa.load()
:
audio_path = 'caminho/do/seu/arquivo.wav'
signal, sr = librosa.load(audio_path, sr=None)
Passo 4: Visualizando o sinal de áudio
Você pode usar o matplotlib para visualizar o sinal de áudio:
plt.figure(figsize=(14, 5))
librosa.display.waveshow(signal, sr=sr)
plt.title('Forma de Onda do Áudio')
plt.xlabel('Tempo (s)')
plt.ylabel('Amplitude')
plt.show()
Passo 5: Extrair o Mel Spectrogram
Calcule e exiba o Mel Spectrogram:
mel_spectrogram = librosa.feature.melspectrogram(y=signal, sr=sr, n_fft=2048, hop_length=1024, n_mels=128)
mel_spectrogram_db = librosa.power_to_db(mel_spectrogram, ref=np.max)
plt.figure(figsize=(14, 5))
librosa.display.specshow(mel_spectrogram_db, sr=sr, x_axis='time', y_axis='mel')
plt.colorbar(format='%+2.0f dB')
plt.title('Mel Spectrogram')
plt.show()
Passo 6: Extrair os MFCCs
Calcule e exiba os MFCCs:
mfccs = librosa.feature.mfcc(y=signal, sr=sr, n_mfcc=13, hop_length=1024)
plt.figure(figsize=(14, 5))
librosa.display.specshow(mfccs, x_axis='time')
plt.colorbar()
plt.title('MFCCs')
plt.show()
Este é um tutorial básico para começar com o processamento de áudio usando Python e LibRosa. Você pode ajustar os parâmetros de acordo com suas necessidades e explorar outras funcionalidades da biblioteca LibRosa para análise de áudio mais avançada. Lembre-se de substituir ‘caminho/do/seu/arquivo.wav’ pelo caminho real do seu arquivo de áudio.