whispr

Transcribe → Summarize → Understand
Whispr ist eine Dockerized Pipeline, die Videos automatisch in Text und Zusammenfassungen umwandelt.
Sie nutzt OpenAI Whisper für die Transkription und LLMs (OpenAI / OpenRouter) für die Zusammenfassung.

✨ Features

🎬 Video → Audio: .mp4 → .mp3 mit ffmpeg
🎧 Audio → Transcript: Transkription mit Whisper (GPU-beschleunigt, falls verfügbar)
📝 Transcript → Summary: Automatische Zusammenfassungen mit OpenAI, OpenRouter oder LM Studio
🐳 Dockerized: Einfache Nutzung mit GPU-Support (zurzeit nur von OP mit NVIDIA GPU's getestet)
⚡ Flags & Workflows: Flexible Ausführung mit --only-transcript oder Standard-Workflow

📂 Projektstruktur

.
├── transcribe.py         # Hauptpipeline
├── transcribe_api.py     # Flask API für Uploads
├── run_whispr.sh         # Script für Docker build & run
├── Dockerfile            # Containerdefinition
├── video/                # Inputvideos (.mp4)
├── audio/                # Extrahiertes Audio (.mp3)
├── transcripts/          # Transkripte (.txt)
├── summaries/            # Zusammenfassungen (.txt)
├── prompt.txt            # Optionaler Custom-Prompt
├── .env                  # API Keys

⚡ Quickstart

1. Clone & Build

git clone https://github.com/yourusername/whispr.git
cd whispr
./setup.sh # erstellt benötigte ordner video/, audio/, transcripts/, summaries/

👉 Baut das Docker-Image whispr und startet den Container mit allen notwendigen Mounts.

2. Videos hinzufügen

Lege deine .mp4 Dateien im Ordner video/ ab.

3. Environment konfigurieren

Erstelle eine .env Datei mit deinen Keys:

OPENAI_API_KEY=sk-xxxx
OPENROUTER_API_KEY=or-xxxx

Wähle den Service in transcribe.py:

SERVICE = "openai"       # "openai", "open-router", or "lm-studio"

Wähle das gewollte AI Modell in transcribe.py:

MODEL_NAME = "gpt-5"       # (By Default its set to an openai API Model)

4. Prompt anpassen

Gegebenenfals prompt.txt nach vorlieben anpassen

5. Pipeline ausführen

Standard (Video → Audio → Transcript → Summary):

./run_whispr.sh

Nur bis Transkript (keine API-Zusammenfassung):

./run_whispr.sh --only-transcript

Hilfe anzeigen:

./run_whispr.sh -h

Die Pipeline konvertiert automatisch:

.mp4 → .mp3
.mp3 → Transkript (transcripts/)
Transkript → Zusammenfassung (summaries/)

🛠 Dependencies

Python 3.10
PyTorch (CUDA falls verfügbar)
Whisper
ffmpeg
requests
python-dotenv

👉 Alles wird automatisch im Docker-Container installiert.

📌 Roadmap

Mehr Whisper-Modelle (tiny, small, medium, large)
Leichtere Konfiguration von genutzten AI-Modellen
Verbessertes docker-handling
Gegebenenfalls automatische Ausführung bei Ablage in Ordner

📄 License

MIT License — frei nutzbar, veränderbar und teilbar.

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
.env.dist		.env.dist
.gitignore		.gitignore
Dockerfile		Dockerfile
README.md		README.md
prompt.txt		prompt.txt
requirements.txt		requirements.txt
run_whispr.sh		run_whispr.sh
setup.sh		setup.sh
transcribe.py		transcribe.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

whispr

✨ Features

📂 Projektstruktur

⚡ Quickstart

1. Clone & Build

2. Videos hinzufügen

3. Environment konfigurieren

4. Prompt anpassen

5. Pipeline ausführen

🛠 Dependencies

📌 Roadmap

📄 License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

whispr

✨ Features

📂 Projektstruktur

⚡ Quickstart

1. Clone & Build

2. Videos hinzufügen

3. Environment konfigurieren

4. Prompt anpassen

5. Pipeline ausführen

🛠 Dependencies

📌 Roadmap

📄 License

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages