circle-exclamation
El contenido de esta página está traducido automáticamente. Zoom no garantiza la precisión.

Funciones del algoritmo

Transcripción en vivo

La función de Transcripción en vivo de Zoom sirve como una tecnología central que habilita muchas funciones de la suite integral de soluciones de IA para el lugar de trabajo de Zoom, incluidas muchas funciones de AI Companion. Al convertir audio en tiempo real en datos de texto estructurados y buscables, la Transcripción en vivo crea la capa fundamental que impulsa resúmenes inteligentes de reuniones, extracción automatizada de elementos de acción, análisis de sentimiento y flujos de trabajo de colaboración avanzados en todo el ecosistema de Zoom Workplace.

Cuando la Transcripción en vivo está habilitada, el audio en vivo de sesiones como reuniones, seminarios web o llamadas telefónicas se transmite al servicio de reconocimiento automático de voz de Zoom, que convierte el habla en texto y distribuye la transcripción dinámica a las aplicaciones de Zoom Workplace de los participantes correspondientes. Los participantes pueden ver la transcripción en tiempo real, acceder a segmentos mediante subtítulos ocultos o aprovechar AI Companion para hacer preguntas en vivo durante la reunión. Después de que la sesión finaliza, si la transcripción se conserva, AI Companion puede utilizarla para funciones dependientes de la transcripción como Resúmenes de reuniones, consultas posteriores a la reunión y seguimientos con conocimiento del contexto, etc.

La Transcripción en vivo funciona de manera independiente a los grandes modelos de lenguaje, confiando en la tecnología de reconocimiento automático de voz de Zoom para convertir audio en texto. Sin embargo, la salida de texto estructurado generada por la Transcripción en vivo sirve como datos de entrada críticos para los grandes modelos de lenguaje que impulsan las funciones avanzadas de AI Companion, permitiendo que estos modelos analicen el contenido de las conversaciones y generen conocimientos inteligentes.

Consulte el Centro de soporte de Zoom para obtener más información sobre cómo la Transcripción en vivo alimenta funciones como las de AI Companion Preguntas durante la reuniónarrow-up-right y Resumen de la reuniónarrow-up-right, así como funciones no pertenecientes a AI Companion como Subtítulos automatizadosarrow-up-right.

Transcripción en vivo local

A partir de la versión 6.5.3 de la aplicación Zoom Workplace, los usuarios pueden acceder ahora a la transcripción en vivo local en el dispositivo, que procesa el audio directamente en su dispositivo en lugar de usar el procesamiento en la nube. Si bien esta opción está diseñada para ofrecer mayor privacidad y menor latencia, las transcripciones generadas mediante el procesamiento local no pueden ser utilizadas por las funciones de AI Companion, que requieren datos de transcripción basados en la nube para funcionar.

Traducción en vivo (subtítulos)

La función de Traducción en vivo de Zoom opera como una extensión de la función de Transcripción en vivo, donde la transcripción en vivo original sirve como base para el proceso de traducción. Los datos de la transcripción en vivo se transmiten desde el módulo de Transcripción en vivo al módulo de traducción en vivo de Zoom, que procesa la transcripción en el idioma de origen detectado y la traduce al o los idiomas de destino solicitados por el usuario. Las transcripciones traducidas se devuelven luego al servicio de transcripción en vivo, que distribuye el contenido localizado a los participantes de la reunión a través de sus aplicaciones de Zoom Workplace, permitiendo una comunicación multilingüe en tiempo real sin interrumpir el flujo natural de la conversación.

Consulte el centro de soporte de Zoom para obtener más información sobre usando subtítulos traducidosarrow-up-right.

Aislamiento de audio personalizado

El Aislamiento de audio personalizado aprovecha la huella de voz de un usuario para diferenciar su voz y suprimir el ruido de fondo, incluso en entornos abiertos. Los usuarios autorizan a Zoom a crear una huella de voz, que captura las características y matices únicos de sus patrones de voz. El usuario también puede optar por subir una grabación de su voz. La huella de voz del usuario permite a Zoom filtrar e aislar de forma inteligente la voz del usuario del audio ambiente detectado por su micrófono. La tecnología suprime eficazmente sonidos ambientales como conversaciones en una cafetería, aspiradoras, perros ladrando o conversaciones de otras personas dentro del alcance del micrófono, ayudando a garantizar que solo la voz del usuario se transmita de forma destacada.

Consulte el centro de soporte de Zoom para obtener más información sobre usando aislamiento de audio personalizadoarrow-up-right.

Última actualización

¿Te fue útil?