Transcribe → Summarize → Understand
Whispr ist eine Dockerized Pipeline, die Videos automatisch in Text und Zusammenfassungen umwandelt.
Sie nutzt OpenAI Whisper für die Transkription und LLMs (OpenAI / OpenRouter) für die Zusammenfassung.
- 🎬 Video → Audio:
.mp4→.mp3mitffmpeg - 🎧 Audio → Transcript: Transkription mit Whisper (GPU-beschleunigt, falls verfügbar)
- 📝 Transcript → Summary: Automatische Zusammenfassungen mit OpenAI, OpenRouter oder LM Studio
- 🐳 Dockerized: Einfache Nutzung mit GPU-Support (zurzeit nur von OP mit NVIDIA GPU's getestet)
- ⚡ Flags & Workflows: Flexible Ausführung mit
--only-transcriptoder Standard-Workflow
.
├── transcribe.py # Hauptpipeline
├── transcribe_api.py # Flask API für Uploads
├── run_whispr.sh # Script für Docker build & run
├── Dockerfile # Containerdefinition
├── video/ # Inputvideos (.mp4)
├── audio/ # Extrahiertes Audio (.mp3)
├── transcripts/ # Transkripte (.txt)
├── summaries/ # Zusammenfassungen (.txt)
├── prompt.txt # Optionaler Custom-Prompt
├── .env # API Keys
git clone https://github.com/yourusername/whispr.git
cd whispr
./setup.sh # erstellt benötigte ordner video/, audio/, transcripts/, summaries/👉 Baut das Docker-Image whispr und startet den Container mit allen notwendigen Mounts.
Lege deine .mp4 Dateien im Ordner video/ ab.
Erstelle eine .env Datei mit deinen Keys:
OPENAI_API_KEY=sk-xxxx
OPENROUTER_API_KEY=or-xxxxWähle den Service in transcribe.py:
SERVICE = "openai" # "openai", "open-router", or "lm-studio"Wähle das gewollte AI Modell in transcribe.py:
MODEL_NAME = "gpt-5" # (By Default its set to an openai API Model)Gegebenenfals prompt.txt nach vorlieben anpassen
Standard (Video → Audio → Transcript → Summary):
./run_whispr.shNur bis Transkript (keine API-Zusammenfassung):
./run_whispr.sh --only-transcriptHilfe anzeigen:
./run_whispr.sh -hDie Pipeline konvertiert automatisch:
.mp4→.mp3.mp3→ Transkript (transcripts/)- Transkript → Zusammenfassung (
summaries/)
👉 Alles wird automatisch im Docker-Container installiert.
- Mehr Whisper-Modelle (
tiny,small,medium,large) - Leichtere Konfiguration von genutzten AI-Modellen
- Verbessertes docker-handling
- Gegebenenfalls automatische Ausführung bei Ablage in Ordner
MIT License — frei nutzbar, veränderbar und teilbar.