Künstliche Intelligenz bei Zoom: Ein Überblick
Künstliche Intelligenz bei Zoom: Ein Überblick
Künstliche Intelligenz entwickelt sich rasant weiter und wird zu einem integralen Bestandteil des Alltags, indem sie alles von großen und kleinen Sprachmodellen bis hin zu spezialisierten algorithmischen Funktionen antreibt. Während generative KI nahtlose Interaktionen zwischen Mensch und Maschine für die Inhaltserstellung, Problemlösung und Entscheidungsfindung ermöglicht, existiert KI auch in stärker spezialisierten Anwendungen. Automatisierungstools straffen Arbeitsabläufe, während Dienste wie Transkription und Übersetzung Kommunikationsbarrieren abbauen und Zusammenarbeit effizienter und zugänglicher machen. Während die KI-Technologie weiter voranschreitet, verwandeln ihre Anwendungen Branchen, indem sie Effizienz, Genauigkeit und Innovation steigern und damit grundlegend die Art und Weise verändern, wie Unternehmen arbeiten.
Angesichts der wachsenden Rolle der KI im modernen Arbeitsumfeld dient das AI Bluepaper als ausführlicher Leitfaden zu KI-Funktionen innerhalb der Zoom-Plattform. Durch die Erkundung einiger wichtiger KI-Einsätze, -Funktionen und -Fähigkeiten von Zoom liefert es Unternehmen die nötigen Erkenntnisse, um KI effektiv zu nutzen — und so Arbeitsabläufe zu optimieren, die Zusammenarbeit zu verbessern und die Produktivität in Teams zu steigern.
Agentische Künstliche Intelligenz: Die autonome, selbstgetriebene Kraft der KI maximal nutzen
Agentische KI bezieht sich auf künstliche Intelligenz, die mehr tun soll als nur Fragen zu beantworten — sie ist darauf ausgelegt, im Namen eines Nutzers aktiv zu handeln. Als KI-zentrierte offene Arbeitsplattform, die für menschliche Verbindung gebaut ist, entwickelt Zoom aktiv agentische KI-Fähigkeiten, um Nutzern zu helfen, nahtlos von Informationen zur Ausführung zu gelangen.
Statt bei Vorschlägen oder Meeting-Zusammenfassungen stehen zu bleiben, ist die Vision für agentische KI, sich zu einem autonomen Assistenten zu entwickeln, der Nutzern dabei hilft, nächste Schritte zu verwalten, Aufgaben zu erledigen und Arbeitsabläufe in Bewegung zu halten. Mit der fortschreitenden Verbesserung der KI-Technologie wird agentische KI zunehmend als personalisierter digitaler Assistent fungieren — dabei helfen, organisiert zu bleiben, Prioritäten nachzuverfolgen und den manuellen Aufwand zu reduzieren, Informationen zwischen Gesprächen, Meetings und Arbeitstools zu verschieben.
Zoom AI Companion: Ihr intelligenter Assistent im Arbeitsumfeld
Der Zoom AI Companion ist ein intelligenter, konversationeller digitaler Assistent im Kern der Zoom Workplace-Plattform, entwickelt, um die Produktivität zu steigern, die Zusammenarbeit zu vereinfachen und die Arbeitsbelastung der Mitarbeitenden zu verringern — ohne zusätzliche Kosten für Kunden, die ausgewählte kostenpflichtige Dienste in ihren Zoom-Benutzerkonten zugewiesen haben.
Da KI-Tools zunehmend in die moderne Arbeitswelt integriert werden, sind sie nicht länger auf die Ausführung spezifischer Aufgaben beschränkt — etwa die Automatisierung der Dateneingabe, das Verfassen von E-Mails, das Erstellen von Berichten oder die Ausführung grundlegender algorithmischer Funktionen. Vielmehr stellen aufkommende KI-Tools einen transformativen Wandel dar, der die Art und Weise, wie wir arbeiten, grundlegend verändert. Der Zoom AI Companion geht über einfache Aufgabenautomatisierung hinaus; er kann als echter Begleiter im Arbeitsalltag eines Nutzers fungieren, allgemeine Wissensfragen beantworten, Inhalte generieren, Einblicke bieten, Dokumente, Nachrichten, Sprachnachrichten und Meetings zusammenfassen, bei Entscheidungsprozessen unterstützen und Nutzern helfen, neue Ziele zu erreichen oder höhere Leistungsniveaus freizusetzen.
Als KI-zentriertes Unternehmen ist der Zoom AI Companion durchdacht über Zooms Produktsuite hinweg integriert, einschließlich Zoom Meetings, Team Chat, Phone, Contact Center, Docs, Whiteboard und mehr. Während Zoom weiterhin Innovationen vorantreibt und seine Fähigkeiten erweitert, wird auch der Zoom AI Companion neue Funktionen und Features erhalten. Nachfolgend finden Sie eine Liste der heute verfügbaren Hauptfunktionen, die zeigen, wie dieser KI-Assistent jeden Aspekt des Arbeitstages eines Nutzers verbessern kann.
Aktuelle Hauptfunktionen und -fähigkeiten umfassen:
Kategorie
Wesentliche Fähigkeiten
Geschäftlicher Nutzen
Zentralisierter KI-Arbeitsbereich
Kontextabhängige Abfrageverarbeitung, intelligentes Scheduling, plattformübergreifende Datensynthese, KI-generierte Folgeaktionen.
Ein einheitliches Produktivitätszentrum mit intelligenter Workflow-Automatisierung.
Meeting-Intelligenz
Echtzeitunterstützung im Meeting, automatisierte Dokumentation, intelligente Aufzeichnungsanalyse, Automatisierung der Vorbereitung.
Verbesserte Meeting-Effektivität von der Vorbereitung bis zur Nachverfolgung.
Kommunikationsverbesserung
Intelligente Chat-Unterstützung, Transkriptanalyse, E-Mail-Verfassung, prädiktives Schreiben.
Beschleunigte Kommunikationsqualität über alle Kanäle hinweg.
Optimierung des Contact Centers
Echtzeit-Sentimentanalyse, Gesprächsintelligenz, Leistungsanalysen, intelligente Antworten.
Verbesserte Kundenerfahrung durch KI-gestützte Erkenntnisse.
Inhaltserstellung
Dokumentenintelligenz, Generierung visueller Inhalte, kollaborative Tools, Medienorganisation.
Vereinfachte Prozesse für Inhaltserstellung und Ideenfindung.
Aufgaben- & Workflow-Management
Automatisierte Aufgabenerstellung, plattformübergreifende Integration, Event-Management-Tools.
Reduzierter administrativer Aufwand durch intelligente Automatisierung.
Wie der Zoom AI Companion die Kraft der agentischen KI nutzt
Der Zoom AI Companion macht den Wert agentischer KI greifbar, indem er Nutzern hilft, Informationen leicht in konkrete Maßnahmen zu verwandeln. Wenn der AI Companion Folgeaufgaben identifiziert — sei es aus einem Meeting, einer Contact-Center-Interaktion oder einer anderen von der KI erkannten Erkenntnis — kann er diese Aktionspunkte automatisch in Zoom Tasks hinzufügen zur Nachverfolgung oder Zuweisung. So wird sichergestellt, dass wichtige nächste Schritte nicht in einer Meeting-Zusammenfassung oder Gesprächsübersicht verloren gehen. Stattdessen werden sie zu klaren, nachverfolgbaren Aufgaben, die vorangebracht werden können. Durch die direkte Verbindung von Erkenntnissen mit Maßnahmen hilft der AI Companion Nutzern, Prioritäten im Blick zu behalten, Verantwortlichkeiten zu managen und ihren Arbeitstag ohne unnötige Reibung voranzutreiben.
Algorithmen: Wie künstliche Intelligenz Kommunikation reibungslos macht
Über die intelligenten, konversationellen LLM-Fähigkeiten des Zoom AI Companion hinaus nutzt Zoom auch andere KI-Dienste (z. B. Algorithmen) auf der gesamten Plattform. Diese Dienste arbeiten oft nahtlos im Hintergrund und treiben Funktionen wie Echtzeit-Sprachtranskription, Live-Übersetzung, persönliche Audio-Unterdrückung und mehr an.
Zusammen schaffen diese Funktionen ein kohärentes, reibungsloses Erlebnis, das sowohl die Qualität als auch die Effizienz jeder Interaktion auf der Zoom-Plattform verbessern kann. Zu den aktuellen wichtigen KI-Dienstfunktionen und -fähigkeiten gehören:
Transkription
Übersetzung
Untertitel (Closed Captioning)
Persönliche Audio-Isolierung
Model Context Protocol (MCP): Ein Standard, um KI mit Tools zu verbinden, damit sie mehr erreichen kann
Als Teil seiner KI-Architektur verwendet Zoom das Model Context Protocol (MCP) — einen offenen Standard, der sichere Verbindungen zwischen Modellen, Tools, Datenquellen und Workflows ermöglicht. MCP spielt eine Schlüsselrolle bei der Weiterentwicklung agentischer KI, indem es die Notwendigkeit für einmalige Integrationen ersetzt, die jedes Unternehmen separat entwickeln und pflegen müsste. Stattdessen bietet es ein gemeinsames, strukturiertes Framework, das Fähigkeiten in konsistenter Weise für KI-Modelle offenlegt. Diese Grundlage erlaubt es KI-Systemen, mehr wie intelligente Agenten zu agieren — indem sie nicht nur Fragen beantworten, sondern auch direkt innerhalb der Systeme, auf die Nutzer angewiesen sind, handeln. Zoom unterstützt MCP derzeit im Rahmen seines Add-ons Custom AI Companion, wodurch Organisationen maßgeschneiderte Agenten erstellen können, die sich mit ihren einzigartigen Datenquellen und Anwendungen verbinden, routinemäßige Workflows automatisieren und auf Basis der tatsächlichen Arbeitsinhalte von Teams maßgeschneiderte, genaue Antworten liefern.
Wie MCP in der Praxis funktioniert
Im Kern basiert MCP auf einem Client–Server-Modell. Man kann sich die KI-Umgebung (wie ChatGPT oder Claude) als einen Client vorstellen, der Arbeit erledigen möchte, und externe Systeme (wie Jira, Confluence oder eine Datenbank) als Server, die veröffentlichen, was sie tun können. Jeder Server stellt eine klare Liste von Funktionen bereit — wie „Wissensdatenbank durchsuchen“ oder „Aufgabe erstellen“. Da diese Funktionen dem gemeinsamen MCP-Format folgen, kann die KI sie sofort verstehen, ohne individuellen Entwicklungsaufwand.
Mit anderen Worten: Die Verbindung einer KI mit einem MCP-Server ist wie das Bestellen in einem Restaurant. Sie (die KI) betreten ein Restaurant, erhalten eine Speisekarte (eine Liste von über den MCP-Server verfügbaren Diensten oder Funktionen), sagen, was Sie möchten, und erhalten eine Antwort. Es gibt kein Rätselraten darüber, was verfügbar ist oder nicht — alles wird im Menü im Voraus bereitgestellt.
Die folgenden Abschnitte liefern zusätzliche Details dazu, wie MCP funktioniert:
Schritt 1: Fähigkeiten über Server offenlegen
Jedes System kann einen MCP-Server betreiben. Dieser Server fungiert als „Speisekarte“ und veröffentlicht eine strukturierte Beschreibung der Aktionen, die er unterstützt. Zum Beispiel könnte Jira Funktionen wie „Issues durchsuchen“ oder „Ticket aktualisieren“ veröffentlichen. Da diese Funktionen dem gemeinsamen MCP-Format folgen, kann die KI sie sofort verstehen, ohne individuelle Programmierung.
Schritt 2: Die KI agiert als Client
Auf der anderen Seite spielt die KI-Umgebung die Rolle des Clients. Sie liest die Liste der verfügbaren Funktionen, merkt sie sich und entscheidet, welche sie beim Antworten auf einen Nutzer aufruft. Das bedeutet, die KI muss nicht im Voraus mit tausenden möglichen Integrationen programmiert werden — sie lernt einfach, was verfügbar ist, wenn die Verbindung hergestellt wird.
Schritt 3: Kontext sicher übermitteln
MCP definiert außerdem, wie Kontext und Berechtigungen übergeben werden. Dies stellt sicher, dass die KI beim Aufrufen einer Funktion nur innerhalb der Grenzen dessen handelt, auf das der Nutzer zugreifen darf. Wenn ein Nutzer beispielsweise nur die Jira-Tickets seines Teams sehen darf, sorgt MCP dafür, dass die KI diesen Umfang respektiert. Diese Sicherheitsebene macht MCP praktisch für den Unternehmenseinsatz, in dem sensible Daten und Zugriffskontrollen unverhandelbar sind.
Warum MCP wichtig ist
Durch die Standardisierung der Art und Weise, wie KI sich mit externen Systemen verbindet, beseitigt MCP die Reibung durch individuelle Integrationen und gewährleistet Sicherheit und Konsistenz. Nutzer profitieren, weil die KI nicht nur Fragen beantworten, sondern auch fundierte Aktionen über eine Vielzahl von Tools hinweg ausführen kann — auf eine Weise, die nahtlos und sicher wirkt.
Agent-to-Agent (A2A) Protocol: Wie KI-Assistenten miteinander kommunizieren
Neben MCP wird Zoom auch das Agent-to-Agent (A2A)-Protokoll als gemeinsame Sprache für die Zusammenarbeit zwischen autonomen Agenten einsetzen. A2A ist ein offener Standard, der es KI-Agenten — die möglicherweise von verschiedenen Anbietern stammen oder in unterschiedlichen Umgebungen laufen — ermöglicht, sich gegenseitig zu entdecken, Kontext zu teilen, Aufgaben zu delegieren und Ergebnisse sicher auszutauschen. Zoom plant, Drittanbieter-KI-Agenten mit dem AI Companion zu unterstützen, indem A2A genutzt wird, um Kontext aus Ihren Zoom-Gesprächen zu beziehen und im Auftrag der Nutzer Aktionen in anderen Geschäftsanwendungen durchzuführen. (Drittanbieter-Agent für ServiceNow Now Assist kommt bald.)
Wenn das Model Context Protocol (MCP) KI-Modelle mit den benötigten Tools und Daten verbindet, stellt A2A die Verbindung zwischen den Agenten her. Zusammen bilden die beiden Standards das Rückgrat interoperabler Multi-Agenten-Systeme, in denen Intelligenz nicht auf ein Modell beschränkt ist, sondern über ein Netzwerk kooperierender Agenten verteilt wird.
Wie A2A in der Praxis funktioniert
Kernidee von A2A ist, dass jeder Agent sowohl als Client als auch als Server agieren kann. Ein Agent kann Hilfe anfordern oder eine Aufgabe delegieren, während ein anderer Agent reagieren und die Aufgabe ausführen kann. Die Kommunikation zwischen ihnen folgt einer gemeinsamen Struktur und einem Sicherheitsmodell, sodass sie sich gegenseitig verstehen können, unabhängig davon, wer die Agenten entwickelt hat oder wo sie ausgeführt werden.
Man kann es sich vorstellen wie ein Team von Spezialisten, die zusammenarbeiten: Jeder Agent hat eine klare Aufgabe, einen Lebenslauf, der beschreibt, was er kann, und eine gemeinsame Art, Arbeit an andere zu übergeben.
Die folgenden Abschnitte beschreiben diesen Prozess Schritt für Schritt:
Schritt 1: Agenten veröffentlichen ihre Fähigkeiten
Jeder A2A-kompatible Agent stellt eine kleine, strukturierte „Agentenkarte“ zur Verfügung. Diese Karte fungiert als Identität und Fähigkeitsprofil des Agenten — sie listet auf, was der Agent tun kann (zum Beispiel „Text zusammenfassen“, „ein Meeting planen“ oder „Daten abfragen“), welche Formate er unterstützt und wie man ihn erreichen kann.
Da diese Karte dem A2A-Standard folgt, kann jeder andere Agent sie lesen und sofort verstehen, wie er interagieren soll, ohne benutzerdefinierten Code oder Konfiguration.
Schritt 2: Agenten entdecken und verbinden sich
Wenn ein Agent zusammenarbeiten möchte, sucht er die Agentenkarte eines anderen Agenten — oft über ein Verzeichnis, ein Register oder einen bekannten Endpunkt — und stellt eine sichere Verbindung her. Dieser Prozess ermöglicht es Agenten, sich dynamisch zu finden, selbst wenn sie von unterschiedlichen Teams oder Organisationen entwickelt wurden.
Die Entdeckung stellt Flexibilität sicher: Ein Agent zur Aufgabenplanung kann einen Visualisierungsagenten finden, oder ein Kundenbetreuungsagent kann einen Übersetzungsagenten lokalisieren, alles über standardisierte Entdeckungsmechanismen.
Schritt 3: Agenten tauschen Aufgaben und Ergebnisse aus
Sobald sie verbunden sind, kommunizieren Agenten über standardisierte Aufgabenmeldungen. Eine Aufgabenmeldung kann eine Anfrage enthalten („analysiere diesen Datensatz“) und eine Antwort („hier sind die Erkenntnisse“). Diese Austausche können synchron für schnelle Vorgänge oder asynchron für länger laufende Aufgaben erfolgen.
A2A unterstützt auch Streaming und Benachrichtigungen, sodass Agenten Zwischenupdates oder Teilergebnisse senden können, während sie arbeiten — ähnlich wie Menschen in Echtzeit zusammenarbeiten würden.
Schritt 4: Sichere Zusammenarbeit und Kontextteilung
Jede Interaktion zwischen Agenten wird durch den Nutzer oder das System, das sie initiiert hat, authentifiziert und in ihrem Umfang begrenzt, sodass Agenten nur auf die Daten oder Fähigkeiten zugreifen können, für die sie autorisiert sind.
Dieser kontrollierte Austausch von Kontext ermöglicht komplexe Workflows — etwa dass ein Agent ein Dokument zusammenfasst, während ein anderer eine Folgeaktion erstellt — ohne dass Informationen offengelegt werden.
Warum A2A wichtig ist
Indem ein universeller Weg definiert wird, wie Agenten miteinander kommunizieren, eröffnet A2A eine neue Ebene der Interoperabilität und Komponierbarkeit. Anstatt massive, monolithische Agenten zu bauen, die versuchen, alles zu können, befähigt A2A Organisationen dazu, spezialisierte Agenten zu entwerfen — jeweils fokussiert auf ein bestimmtes Gebiet — und diese über ein gemeinsames Protokoll zusammenarbeiten zu lassen.
Für Unternehmen bedeutet das:
Kompatibilität über Anbieter hinweg: Agenten verschiedener Anbieter können sicher zusammenarbeiten.
Skalierbares Design: Teams können Agenten hinzufügen oder ersetzen, ohne ganze Systeme neu zu gestalten.
Gesteuerte Automatisierung: Sicherheit, Beobachtbarkeit und Auditierung werden von Anfang an standardisiert.
Schnellere Innovation: Neue Fähigkeiten können einfach eingeführt werden, indem eine neue Agentenkarte veröffentlicht wird — ohne bestehende Integrationen umzustrukturieren.
Zuletzt aktualisiert
War das hilfreich?

