Home – KI-Shorts – KI-Intensiv-Schulung 3h – ElevenLabs Kompakt

ElevenLabs Kompakt

Führende Unternehmen nutzen ElevenLabs, um ihr Geschäftsmodell zu erweitern. Ob für KI-Sprachagenten, Nachhilfe oder Medienerstellung – die ElevenLabs Modelle bieten Lösungen für viele Anforderungen.

⚡ Angebot verlängert bis 31.08.2026

234 €

netto statt ~~284 €~~ 50 € gespart

Nächste Termine:

Di, 01.09.2026 - 09:00-12:00 Uhr

Do, 10.09.2026 - 09:00-12:00 Uhr

Di, 15.09.2026 - 09:00-12:00 Uhr

Do, 17.09.2026 - 13:00-16:00 Uhr

Mi 23.09.2026 - 09:00-12:00 Uhr

Di 29.09.2026 - 09:00-12:00 Uhr

Mo, 05.10.2026 - 09:00-12:00 Uhr

Do, 08.10.2026 - 09:00-12:00 Uhr

Di, 13.10.2026 - 13:00-16:00 Uhr

Was Sie in diesem 3h-Intensivkurs lernen

Vom Einsteiger zum Power-User

ElevenLabs Kompakt: Professionelle KI-Audio für Stimmen, Agenten und Musik

ElevenLabs Business-Training: Sprach-KI im Unternehmen einsetzen | 3h Intensiv | Online

ElevenLabs ist 2026 längst nicht mehr „nur ein Text-to-Speech-Anbieter“. Aus dem Stimmen-Generator von 2023 ist eine vollständige AI-Audio-Plattform geworden, die in drei Säulen organisiert ist: ausdrucksstarke Stimmen mit dem Modell Eleven v3, ElevenAgents für sprachgesteuerte Geschäftsprozesse und Eleven Music für komplette Songs und Instrumentals. Dazu kommt mit Scribe eine eigene Spitzen-Transkriptionsengine.

Mit der allgemeinen Verfügbarkeit von Eleven v3 seit März 2026 hat sich auch die Bedienlogik verändert: Statt SSML-Codes setzt man heute Audio Tags wie [whispers], [excited] oder [sighs] direkt in den Text – und steuert damit die Performance des KI-Sprechers fast so präzise wie bei einer Sprachregie-Sitzung. Über 70 Sprachen, Multi-Speaker-Dialoge und sub-100-Millisekunden-Latenz für Live-Anwendungen runden das Bild ab.

In drei kompakten Stunden lernst du das ganze Studio kennen, weißt, welches Modell für welchen Zweck taugt – und kannst ElevenLabs in deinen eigenen Audio- oder Kommunikations-Workflow einbauen.

Was du aus unserer Schulung mitnimmst

Du verstehst die aktuelle Modellfamilie und triffst eine fundierte Wahl zwischen Qualität (v3) und Geschwindigkeit (Flash v2.5). Du beherrschst Audio Tags, Voice Cloning und Voice Design für reproduzierbar gute Ergebnisse. Du weißt, was ElevenAgents von klassischen Chatbots unterscheidet und wann sich der Aufbau eines eigenen Sprach-Agenten für dein Unternehmen lohnt. Und du kennst die Pflichten, die ab dem 2.8.2026 mit dem EU AI Act für synthetische Stimmen gelten.

Inhalte und Lernziele

Lernziel: Die ElevenLabs-Plattform 2026 verstehen und Modelle gezielt einsetzen.
Die aktuelle Modellfamilie
- Eleven v3 – Flaggschiff für hochwertige Narration, 70+ Sprachen, audiogesteuerte Emotionen, deutlich weniger Fehler bei komplexen Texten (Zahlen, chemische Formeln, Eigennamen). Nicht für Echtzeit.
- Eleven Flash v2.5 – Echtzeit-Modell mit etwa 75 Millisekunden Latenz, Standard für Live-Konversation
- Multilingual v2 – bewährter Allrounder, 29 Sprachen, gut etabliert für Voice Clones
Audio Tags – das neue Steuerungsprinzip in v3 – [whispers], [shouts], [laughs], [sarcastically], [strong X accent] und sogar [sings]. Wir bauen den Workflow auf, mit dem ein Voiceover wie eine Regie-Anweisung klingt
Text-to-Dialogue – mehrere Sprecher in einer einzigen Audiodatei, mit natürlichen Überlappungen und Stimmungswechseln. Spart in der Postproduktion erhebliche Zeit
Voice Library, Voice Design und Voice Changer – fertige Stimmen wählen, eigene Stimmen aus Beschreibungen erzeugen, bestehende Aufnahmen in andere Stimmen umwandeln
Eleven Music und Scribe im Überblick – kompakter Blick auf den Musik- und Transkriptions-Stack für später (Schwerpunkt liegt in Modul 2 und 3)
Praxis: Gleicher Text, drei Modelle, Audio-Tag-Variationen – wir hören die Unterschiede direkt

Lernziel: Eigene Audioinhalte mit professionellem Anspruch produzieren.
Instant Voice Clone vs. Professional Voice Clone – wann reicht IVC, wann braucht es ein PVC, und warum für v3 derzeit IVCs oder Stock-Stimmen empfohlen werden
Hochwertige Aufnahmen für Cloning – Mikrofon, Raum, Skript, Aufnahmedauer: was den Unterschied zwischen brauchbar und brillant macht
Live-Demo: Eine Teilnehmerstimme klonen und in v3 mit Audio Tags performen lassen
Voice Design – Stimmen aus reiner Textbeschreibung generieren („mittelalter, warmer Bariton, leicht nordischer Akzent“) für Charaktere, Hörspiele oder Avatar-Stimmen
Voice Isolator und Sound Effects – Stimmen aus verrauschten Aufnahmen extrahieren, Geräusche per Prompt erzeugen
Eleven Music – komplette Songs mit Lyrics in mehreren Sprachen, reine Instrumentals, In-Painting für sektionsweises Bearbeiten (zum Beispiel den Refrain neu generieren), Stem Separation für die professionelle Weiterverarbeitung
Scribe – Transkription mit Sprecher-Erkennung (Speaker Diarization) und Zeitstempeln auf Zeichenebene; Anwendungsfälle in Untertitelung, Meeting-Protokollen und Compliance
Praxis: Eigenes Mini-Projekt – ein vertonter Spot oder Erklärclip vom Skript bis zum fertigen Audio

Lernziel: ElevenLabs strategisch im Unternehmen einsetzen.
ElevenAgents – die Konversationsplattform: was Sprachagenten von 2026 von klassischen IVR-Systemen oder Chatbots unterscheidet
Architektur eines Sprach-Agenten
- Bring Your Own LLM – Anbindung von GPT, Claude, Gemini, Qwen oder einem eigenen Modell als Reasoning-Layer
- Turn-Taking-Modell – das System erkennt natürliche Sprechpausen und Füllwörter („ähm“, „also“) und reagiert nicht zu früh oder zu spät
- Tool Calls via MCP – Agenten greifen während des Gesprächs auf CRM, Kalender, Buchungssysteme oder Zahlungsdienste zu
- RAG mit eigener Wissensbasis – Agenten antworten auf Basis deiner Dokumentation, nicht auf Basis allgemeiner Trainingsdaten
Telefonie und Messaging – Twilio-, Vonage- und SIP-Anbindung für In- und Outbound-Telefonie, WhatsApp-Outbound seit Februar 2026
Praktische Anwendungsfälle
- Inbound: Terminvereinbarung, Service-Anfragen, First-Level-Support
- Outbound: Lead-Qualifizierung, Wiedervorlagen, mehrsprachige Vertriebskommunikation
- Intern: personalisiertes Onboarding, E-Learning-Tutoren, Barrierefreiheit
Audio-Branding – konsistente Markenstimme über alle Kanäle: Hotline, Spot, Erklärvideo, Avatar
EU AI Act und Transparenzpflichten
- Ab dem 2.8.2026 gelten die Transparenzpflichten aus Artikel 50 vollständig – KI-generierte und KI-bearbeitete Stimmen müssen gegenüber Endnutzern als solche kenntlich gemacht werden
- Was das in der Praxis bedeutet: Hinweis am Gesprächsanfang bei Sprach-Agenten, Kennzeichnung bei veröffentlichten Audioinhalten
- AI Speech Classifier von ElevenLabs als technische Hilfe: prüfbar, ob ein Audio auf der Plattform erzeugt wurde
- Compliance-Pluspunkte für Unternehmen: SOC 2, HIPAA-Support, DSGVO, EU Data Residency, Zero Retention auf Wunsch
Praxis: Konzept für einen ersten Sprach-Agenten im eigenen Anwendungsfall skizzieren

Kurs-Info

Podcaster:innen, Hörbuch-Produzent:innen und Audio-Content-Creator
Marketing- und Kommunikationsteams mit Bedarf an mehrsprachigen Voice-Overs
E-Learning-Verantwortliche und Schulungs-Profis
Kundenservice- und Vertriebsteams, die Sprach-Agenten evaluieren
Agenturen für skalierbare Audio-Produktion und internationale Kampagnen
Game-Entwickler:innen für Charakterstimmen und Voice-Prototyping
Verantwortliche für Barrierefreiheit und inklusive Kommunikation K
MU und Start-ups, die KI-Stimmen oder Sprach-Agenten einsetzen möchten

Technisch: Rechner mit stabiler Internetverbindung, aktueller Browser (Chrome, Firefox, Safari), Headset empfohlen. ElevenLabs-Account (für die meisten Übungen reicht der kostenlose Free-Tier; für Voice Cloning und längere Texte ist ein Starter-Abo ab 5 $/Monat sinnvoll – das lässt sich für den Kurszeitraum anlegen und danach kündigen).
Inhaltlich: Grundlegender Umgang mit dem Computer, Erfahrung mit Audio- oder Content-Tools ist hilfreich, aber nicht zwingend. Bereitschaft zum aktiven Mitmachen.

Dauer: 3 Stunden (inkl. 15 Min Pause)
Format: Live Online-Training via Zoom (alternativ MS Teams oder Webex)
Vormittag: 09:00-12:00 Uhr oder
Nachmittag: 13:00-16:00 Uhr
Gruppengröße: max. 6 Teilnehmer:innen (Firmentraining ab 2 TN)
Sprache: Deutsch / Englisch
Nachbetreuung: 30 Tage E-Mail-Support inklusive

Standardpreis: 248 € netto
Frühbucherpreis bei Buchung bis spätestens 28 Tage vor Kursbeginn. Zusätzlich gelten gelegentliche Aktionspreise – diese werden direkt am Kurs ausgewiesen.
Firmenrabatt: 10% ab 2 Teilnehmern, 15% ab 3 Teilnehmern, 25% ab 4 Teilnehmern
Inklusive:
Eleven Labs Tutorial (PDF)
Teilnahme-Zertifikat
Optional: Aufzeichnung nach Absprache (Lizenz gg. Gebühr erhältlich)