LAS MONEDAS DE JUDAS: Instalación de la app de inteligencia artificial Whisper para transcribir y traducir audios en Debian, una distro de GNU/Linux

jueves, 25 de julio de 2024

Instalación de la app de inteligencia artificial Whisper para transcribir y traducir audios en Debian, una distro de GNU/Linux

Hago este artículo para solventar una serie de dudas sobre la instalación de la app de inteligencia artificial Whisper en la distribución de GNU/Linux de Debian 12 Bookworm; porque hay muchos vídeos donde indican cómo se hace instalación pero en informática sigo prefiriendo los artículos en blogs porque es mucho más cómodo. de realizar la instalación y va más al grano.. Yo tengo una torre PC y una una tarjeta gráfica NVIDIA y parece que durante este proceso se instala CUDA, algo necesario. Esté método vale tanto para los que tienen instalados el driver libre de NVIDIA como el driver propietario.

Actualizar el sistema (como root):

sudo apt update
sudo apt upgrade -y

Instalar dependencias necesarias (como root):

sudo apt install -y git python3 python3-pip ffmpeg

Crear y activar un entorno virtual (como usuario normal):

python3 -m venv whisper-venv
source whisper-venv/bin/activate

Instalar Whisper (como usuario normal dentro del entorno virtual):

git clone https://github.com/openai/whisper.git
cd whisper
pip install -r requirements.txt
pip install .

Instalar PyTorch (como usuario normal dentro del entorno virtual):

pip install torch torchvision torchaudio

Verificar la instalación (como usuario normal dentro del entorno virtual):

whisper --help

Después abre un terminal, activa el entorno virtual

source whisper-venv/bin/activate

Nota: asegúrate de que tu entorno virtual está activado durante estos pasos, de lo contrario, los paquetes se instalarán en el sistema global de Python en lugar del entorno virtual.

Al seguir estos pasos correctamente, tendrás Whisper instalado en tu entorno virtual sin necesidad de privilegios de root.

Y ahora, imagina que tienes un archivo de audio en español y quieres transcribirlo en archivos en todos los formatos de texto posibles que permite Whisper. Ejecuta este comando como usuario normal:

whisper input.wav --model small --output_format all

Ahora imagina que quieres traducir un archivo de audio al español

whisper input.wav --model=medium --task=transcribe --language=es

Y cuando acabes, desactiva el Entorno Virtual con el siguiente comando como usuario normal:

deactivate

Siguiendo estos pasos, podrás transcribir archivos de audio utilizando Whisper en tu entorno Debian 12.