ElevenLabs Kompakt

Führende Unternehmen nutzen ElevenLabs, um ihr Geschäftsmodell zu erweitern. Ob für KI-Sprachagenten, Nachhilfe oder Medienerstellung – die ElevenLabs Modelle bieten Lösungen für viele Anforderungen.
Eleven Labs Beitragsbild KI Short

⚡ Angebot verlängert bis 31.08.2026

234 €
netto statt 284 € 50 € gespart

Nächste Termine:

Was Sie in diesem 3h-Intensivkurs lernen

Vom Einsteiger zum Power-User

ElevenLabs Kompakt: Professionelle KI-Audio für Stimmen, Agenten und Musik

ElevenLabs ist 2026 längst nicht mehr „nur ein Text-to-Speech-Anbieter“. Aus dem Stimmen-Generator von 2023 ist eine vollständige AI-Audio-Plattform geworden, die in drei Säulen organisiert ist: ausdrucksstarke Stimmen mit dem Modell Eleven v3, ElevenAgents für sprachgesteuerte Geschäftsprozesse und Eleven Music für komplette Songs und Instrumentals. Dazu kommt mit Scribe eine eigene Spitzen-Transkriptionsengine.

Mit der allgemeinen Verfügbarkeit von Eleven v3 seit März 2026 hat sich auch die Bedienlogik verändert: Statt SSML-Codes setzt man heute Audio Tags wie [whispers], [excited] oder [sighs] direkt in den Text – und steuert damit die Performance des KI-Sprechers fast so präzise wie bei einer Sprachregie-Sitzung. Über 70 Sprachen, Multi-Speaker-Dialoge und sub-100-Millisekunden-Latenz für Live-Anwendungen runden das Bild ab.

In drei kompakten Stunden lernst du das ganze Studio kennen, weißt, welches Modell für welchen Zweck taugt – und kannst ElevenLabs in deinen eigenen Audio- oder Kommunikations-Workflow einbauen.

Du verstehst die aktuelle Modellfamilie und triffst eine fundierte Wahl zwischen Qualität (v3) und Geschwindigkeit (Flash v2.5). Du beherrschst Audio Tags, Voice Cloning und Voice Design für reproduzierbar gute Ergebnisse. Du weißt, was ElevenAgents von klassischen Chatbots unterscheidet und wann sich der Aufbau eines eigenen Sprach-Agenten für dein Unternehmen lohnt. Und du kennst die Pflichten, die ab dem 2.8.2026 mit dem EU AI Act für synthetische Stimmen gelten.

  • Lernziel: Die ElevenLabs-Plattform 2026 verstehen und Modelle gezielt einsetzen.
  • Die aktuelle Modellfamilie
    • Eleven v3 – Flaggschiff für hochwertige Narration, 70+ Sprachen, audiogesteuerte Emotionen, deutlich weniger Fehler bei komplexen Texten (Zahlen, chemische Formeln, Eigennamen). Nicht für Echtzeit.
    • Eleven Flash v2.5 – Echtzeit-Modell mit etwa 75 Millisekunden Latenz, Standard für Live-Konversation
    • Multilingual v2 – bewährter Allrounder, 29 Sprachen, gut etabliert für Voice Clones
  • Audio Tags – das neue Steuerungsprinzip in v3[whispers], [shouts], [laughs], [sarcastically], [strong X accent] und sogar [sings]. Wir bauen den Workflow auf, mit dem ein Voiceover wie eine Regie-Anweisung klingt
  • Text-to-Dialogue – mehrere Sprecher in einer einzigen Audiodatei, mit natürlichen Überlappungen und Stimmungswechseln. Spart in der Postproduktion erhebliche Zeit
  • Voice Library, Voice Design und Voice Changer – fertige Stimmen wählen, eigene Stimmen aus Beschreibungen erzeugen, bestehende Aufnahmen in andere Stimmen umwandeln
  • Eleven Music und Scribe im Überblick – kompakter Blick auf den Musik- und Transkriptions-Stack für später (Schwerpunkt liegt in Modul 2 und 3)
  • Praxis: Gleicher Text, drei Modelle, Audio-Tag-Variationen – wir hören die Unterschiede direkt
  • Lernziel: Eigene Audioinhalte mit professionellem Anspruch produzieren.
  • Instant Voice Clone vs. Professional Voice Clone – wann reicht IVC, wann braucht es ein PVC, und warum für v3 derzeit IVCs oder Stock-Stimmen empfohlen werden
  • Hochwertige Aufnahmen für Cloning – Mikrofon, Raum, Skript, Aufnahmedauer: was den Unterschied zwischen brauchbar und brillant macht
  • Live-Demo: Eine Teilnehmerstimme klonen und in v3 mit Audio Tags performen lassen
  • Voice Design – Stimmen aus reiner Textbeschreibung generieren („mittelalter, warmer Bariton, leicht nordischer Akzent“) für Charaktere, Hörspiele oder Avatar-Stimmen
  • Voice Isolator und Sound Effects – Stimmen aus verrauschten Aufnahmen extrahieren, Geräusche per Prompt erzeugen
  • Eleven Music – komplette Songs mit Lyrics in mehreren Sprachen, reine Instrumentals, In-Painting für sektionsweises Bearbeiten (zum Beispiel den Refrain neu generieren), Stem Separation für die professionelle Weiterverarbeitung
  • Scribe – Transkription mit Sprecher-Erkennung (Speaker Diarization) und Zeitstempeln auf Zeichenebene; Anwendungsfälle in Untertitelung, Meeting-Protokollen und Compliance
  • Praxis: Eigenes Mini-Projekt – ein vertonter Spot oder Erklärclip vom Skript bis zum fertigen Audio
  • Lernziel: ElevenLabs strategisch im Unternehmen einsetzen.
  • ElevenAgents – die Konversationsplattform: was Sprachagenten von 2026 von klassischen IVR-Systemen oder Chatbots unterscheidet
  • Architektur eines Sprach-Agenten
    • Bring Your Own LLM – Anbindung von GPT, Claude, Gemini, Qwen oder einem eigenen Modell als Reasoning-Layer
    • Turn-Taking-Modell – das System erkennt natürliche Sprechpausen und Füllwörter („ähm“, „also“) und reagiert nicht zu früh oder zu spät
    • Tool Calls via MCP – Agenten greifen während des Gesprächs auf CRM, Kalender, Buchungssysteme oder Zahlungsdienste zu
    • RAG mit eigener Wissensbasis – Agenten antworten auf Basis deiner Dokumentation, nicht auf Basis allgemeiner Trainingsdaten
  • Telefonie und Messaging – Twilio-, Vonage- und SIP-Anbindung für In- und Outbound-Telefonie, WhatsApp-Outbound seit Februar 2026
  • Praktische Anwendungsfälle
    • Inbound: Terminvereinbarung, Service-Anfragen, First-Level-Support
    • Outbound: Lead-Qualifizierung, Wiedervorlagen, mehrsprachige Vertriebskommunikation
    • Intern: personalisiertes Onboarding, E-Learning-Tutoren, Barrierefreiheit
  • Audio-Branding – konsistente Markenstimme über alle Kanäle: Hotline, Spot, Erklärvideo, Avatar
  • EU AI Act und Transparenzpflichten
    • Ab dem 2.8.2026 gelten die Transparenzpflichten aus Artikel 50 vollständig – KI-generierte und KI-bearbeitete Stimmen müssen gegenüber Endnutzern als solche kenntlich gemacht werden
    • Was das in der Praxis bedeutet: Hinweis am Gesprächsanfang bei Sprach-Agenten, Kennzeichnung bei veröffentlichten Audioinhalten
    • AI Speech Classifier von ElevenLabs als technische Hilfe: prüfbar, ob ein Audio auf der Plattform erzeugt wurde
    • Compliance-Pluspunkte für Unternehmen: SOC 2, HIPAA-Support, DSGVO, EU Data Residency, Zero Retention auf Wunsch
  • Praxis: Konzept für einen ersten Sprach-Agenten im eigenen Anwendungsfall skizzieren
  • Podcaster:innen, Hörbuch-Produzent:innen und Audio-Content-Creator
  • Marketing- und Kommunikationsteams mit Bedarf an mehrsprachigen Voice-Overs
  • E-Learning-Verantwortliche und Schulungs-Profis
  • Kundenservice- und Vertriebsteams, die Sprach-Agenten evaluieren
  • Agenturen für skalierbare Audio-Produktion und internationale Kampagnen
  • Game-Entwickler:innen für Charakterstimmen und Voice-Prototyping
  • Verantwortliche für Barrierefreiheit und inklusive Kommunikation K
  • MU und Start-ups, die KI-Stimmen oder Sprach-Agenten einsetzen möchten
  • Technisch: Rechner mit stabiler Internetverbindung, aktueller Browser (Chrome, Firefox, Safari), Headset empfohlen. ElevenLabs-Account (für die meisten Übungen reicht der kostenlose Free-Tier; für Voice Cloning und längere Texte ist ein Starter-Abo ab 5 $/Monat sinnvoll – das lässt sich für den Kurszeitraum anlegen und danach kündigen).
  • Inhaltlich: Grundlegender Umgang mit dem Computer, Erfahrung mit Audio- oder Content-Tools ist hilfreich, aber nicht zwingend. Bereitschaft zum aktiven Mitmachen.
  • Dauer: 3 Stunden (inkl. 15 Min Pause)
  • Format: Live Online-Training via Zoom (alternativ MS Teams oder Webex)
  • Vormittag: 09:00-12:00 Uhr oder
  • Nachmittag: 13:00-16:00 Uhr
  • Gruppengröße: max. 6 Teilnehmer:innen (Firmentraining ab 2 TN)
  • Sprache: Deutsch / Englisch
  • Nachbetreuung: 30 Tage E-Mail-Support inklusive
  • Standardpreis: 248 € netto
  • Frühbucherpreis bei Buchung bis spätestens 28 Tage vor Kursbeginn. Zusätzlich gelten gelegentliche Aktionspreise – diese werden direkt am Kurs ausgewiesen.
  • Firmenrabatt: 10% ab 2 Teilnehmern, 15% ab 3 Teilnehmern, 25% ab 4 Teilnehmern
  • Inklusive:
  • Eleven Labs Tutorial (PDF)
  • Teilnahme-Zertifikat
  • Optional: Aufzeichnung nach Absprache (Lizenz gg. Gebühr erhältlich)

Link zur Website von ElevenLabs

ElevenLabs Schulung unserTRAINING.de
ElevenLabs Scchulung

Weitere unserTRAINING.de Schulungen zum Thema Audiobearbeitung:

Eleven Labs Beitragsbild KI Short

Zielgruppe

- Geschäftsführer:innen & Management - Marketing-Professionals - Freelancer & Berater:innen - Teams & Mitarbeiter:innen

✅ Voraussetzungen

- Internetverbindung - Account für die jeweilige Lösung (wird erklärt) - Bereitschaft zum Mitmachen

📋 Details

- Dauer: 3 Stunden - Format: Live Online-Training - Sprache: Deutsch / Englisch - Zertifikat: Inklusive

Nur noch ein kleiner Schritt.

Sichern Sie sich jetzt Ihren Platz und profitieren Sie von unserem Aktionspreis!