Algorithmenfunktionen
Live-Transkription
Die Live-Transkription-Funktion von Zoom dient als Kerntechnologie, die viele Funktionen von Zooms umfassendem Portfolio an KI-Arbeitsplatzlösungen ermöglicht, einschließlich vieler Funktionen des AI Companion. Durch die Umwandlung von Echtzeit-Audio in strukturierte, durchsuchbare Textdaten schafft die Live-Transkription die grundlegende Schicht, die intelligente Meeting-Zusammenfassungen, die automatische Extraktion von Aufgaben, Sentiment-Analysen und fortgeschrittene Kollaborations-Workflows im gesamten Zoom Workplace-Ökosystem antreibt.
Wenn Live-Transkription aktiviert ist, werden Live-Audiodaten aus Sitzungen wie Meetings, Webinaren oder Telefonaten an Zooms automatische Spracherkennungsdienst übermittelt, der die Sprache in Text umwandelt und das dynamische Transkript an die entsprechenden Teilnehmer-Apps im Zoom Workplace verteilt. Teilnehmer können das Transkript in Echtzeit sehen, Segmente über Untertitel (closed captioning) aufrufen oder den AI Companion nutzen, um live Fragen während des Meetings zu stellen. Nachdem die Sitzung beendet ist, kann das Transkript, sofern es aufbewahrt wird, vom AI Companion für transkriptabhängige Funktionen wie Meeting-Zusammenfassungen, Nachfragen nach dem Meeting und kontextbezogene Folgeaktionen weiterverwendet werden.
Die Live-Transkription arbeitet unabhängig von großen Sprachmodellen und stützt sich stattdessen auf Zooms automatische Spracherkennungstechnologie zur Umwandlung von Audio in Text. Das von der Live-Transkription erzeugte strukturierte Textoutput dient jedoch als wichtige Eingabedaten für große Sprachmodelle, die die erweiterten Funktionen des AI Companion antreiben, indem sie es den Modellen ermöglichen, Gesprächsinhalte zu analysieren und intelligente Erkenntnisse zu erzeugen.

Weitere Informationen dazu, wie die Live-Transkription Funktionen wie die des AI Companion unterstützt, finden Sie im Support-Center von Zoom Fragen im Meeting als Meeting-Zusammenfassung, sowie Funktionen außerhalb des AI Companion wie Automatische Untertitel.
Lokale Live-Transkription
Ab Version 6.5.3 der Zoom Workplace-App können Benutzer jetzt lokale, gerätebasierte Live-Transkription nutzen, die Audio direkt auf ihrem Gerät verarbeitet, anstatt cloudbasiert zu verarbeiten. Während diese Option auf gesteigerten Datenschutz und geringere Latenz ausgelegt ist, können durch lokale Verarbeitung erzeugte Transkripte nicht von AI Companion-Funktionen verwendet werden, da diese cloudbasierte Transkript-Daten benötigen, um zu funktionieren.
Live-Übersetzung (Untertitel)
Die Live-Übersetzungsfunktion von Zoom arbeitet als Erweiterung der Live-Transkription, wobei das ursprüngliche Live-Transkript die Grundlage für den Übersetzungsprozess bildet. Die Live-Transkript-Daten werden vom Live-Transkriptionsmodul an das Live-Übersetzungsmodul von Zoom übermittelt, das das Transkript in der erkannten Quellsprache verarbeitet und in die vom Benutzer gewünschten Zielsprache(n) übersetzt. Die übersetzten Transkripte werden anschließend an den Live-Transkriptionsdienst zurückgegeben, der die lokalisierten Inhalte über die Zoom Workplace-Apps an die Meeting-Teilnehmer verteilt und so eine mehrsprachige Kommunikation in Echtzeit ermöglicht, ohne den natürlichen Gesprächsfluss zu unterbrechen.


Weitere Informationen zum mit übersetzten Untertiteln.
Personalisierte Audio-Isolierung
Die personalisierte Audio-Isolierung nutzt ein Stimmprofil des Nutzers, um dessen Stimme zu unterscheiden und Hintergrundgeräusche selbst in offenen Umgebungen zu unterdrücken. Benutzer erteilen Zoom die Erlaubnis, ein Stimmprofil zu erstellen, das die einzigartigen Merkmale und Nuancen ihres Stimmverhaltens erfasst. Der Benutzer kann auch wählen, eine Aufnahme seiner Stimme hochzuladen. Das Stimmprofil ermöglicht es Zoom, die Stimme des Benutzers intelligent von Umgebungsgeräuschen zu filtern und zu isolieren, die vom Mikrofon erfasst werden. Die Technologie unterdrückt effektiv Umgebungsgeräusche wie Gespräche in Cafés, Staubsauger, bellende Hunde oder Unterhaltungen anderer Personen in Mikrofonreichweite und sorgt so dafür, dass hauptsächlich die Stimme des Benutzers übertragen wird.
Weitere Informationen zum mit personalisierter Audio-Isolierung.
Zuletzt aktualisiert
War das hilfreich?

