Hago este artículo para solventar una serie de dudas sobre la instalación de la app de inteligencia artificial Whisper en la distribución de GNU/Linux de Debian 12 Bookworm; porque hay muchos vídeos donde indican cómo se hace instalación pero en informática sigo prefiriendo los artículos en blogs porque es mucho más cómodo. de realizar la instalación y va más al grano.. Yo tengo una torre PC y una una tarjeta gráfica NVIDIA y parece que durante este proceso se instala CUDA, algo necesario. Esté método vale tanto para los que tienen instalados el driver libre de NVIDIA como el driver propietario.
Actualizar el sistema (como root):
sudo apt update
sudo apt upgrade -y
Instalar dependencias necesarias (como root):
sudo apt install -y git python3 python3-pip ffmpeg
Crear y activar un entorno virtual (como usuario normal):
python3 -m venv whisper-venvsource whisper-venv/bin/activate
Instalar Whisper (como usuario normal dentro del entorno virtual):
git clone https://github.com/openai/whisper.gitcd whisperpip install -r requirements.txtpip install .
Instalar PyTorch (como usuario normal dentro del entorno virtual):
pip install torch torchvision torchaudio
Verificar la instalación (como usuario normal dentro del entorno virtual):
whisper --help
Después abre un terminal, activa el entorno virtual
source whisper-venv/bin/activate
Al seguir estos pasos correctamente, tendrás Whisper instalado en tu entorno virtual sin necesidad de privilegios de root.
Y ahora, imagina que tienes un archivo de audio en español y quieres transcribirlo en archivos en todos los formatos de texto posibles que permite Whisper. Ejecuta este comando como usuario normal:
whisper input.wav --model small --output_format all
Ahora imagina que quieres traducir un archivo de audio al español
whisper input.wav --model=medium --task=transcribe --language=es
Y cuando acabes, desactiva el Entorno Virtual con el siguiente comando como usuario normal:
deactivate