Avalie seus conhecimentos
1. Em que unidades a taxa de amostragem é medida?
2. Ao usar o streaming de um grande dataset de áudio, em que momento ele se torna disponível para usá-lo?
3. O que é um espectrograma?
4. Qual é a maneira mais fácil de converter dados de áudio brutos em espectrograma log-mel esperado pelo Whisper?
A.
librosa.feature.melspectrogram(audio["array"])
B.
feature_extractor = WhisperFeatureExtractor.from_pretrained("openai/whisper-small")
feature_extractor(audio["array"])
C.
dataset.feature(audio["array"], model="whisper")
5. Como você carrega um conjunto de dados do 🤗 Hub?
A.
from datasets import load_dataset
dataset = load_dataset(DATASET_NAME_ON_HUB)
B.
import librosa
dataset = librosa.load(PATH_TO_DATASET)
C.
from transformers import load_dataset
dataset = load_dataset(DATASET_NAME_ON_HUB)