# Tính năng của thuật toán

### bản chép lời trực tiếp

Tính năng bản chép lời trực tiếp của Zoom đóng vai trò là công nghệ cốt lõi, cho phép nhiều tính năng trong bộ giải pháp nơi làm việc AI toàn diện của Zoom, bao gồm nhiều tính năng của AI Companion. Bằng cách chuyển đổi âm thanh thời gian thực thành dữ liệu văn bản có cấu trúc và có thể tìm kiếm, bản chép lời trực tiếp tạo ra lớp nền tảng hỗ trợ các bản tóm tắt cuộc họp thông minh, trích xuất mục hành động tự động, phân tích cảm xúc và các quy trình cộng tác nâng cao trên toàn bộ hệ sinh thái Zoom Workplace.

Khi bản chép lời trực tiếp được bật, âm thanh trực tiếp từ các phiên như cuộc họp, hội thảo trên web hoặc cuộc gọi điện thoại sẽ được truyền vào dịch vụ nhận dạng giọng nói tự động của Zoom, dịch giọng nói thành văn bản và phân phối bản chép lời động đến các ứng dụng Zoom Workplace của những người tham gia áp dụng. Người tham gia có thể xem bản chép lời theo thời gian thực, truy cập các đoạn thông qua phụ đề trực tiếp, hoặc tận dụng AI Companion để đặt câu hỏi trong cuộc họp trực tiếp. Sau khi phiên kết thúc, nếu bản chép lời được lưu giữ, AI Companion có thể tiếp tục sử dụng cho các tính năng phụ thuộc vào bản chép lời như Tóm tắt cuộc họp, truy vấn sau cuộc họp và các câu theo dõi có nhận biết ngữ cảnh, v.v.

Bản chép lời trực tiếp hoạt động độc lập với các mô hình ngôn ngữ lớn, thay vào đó dựa vào công nghệ nhận dạng giọng nói tự động của Zoom để chuyển đổi âm thanh thành văn bản. Tuy nhiên, đầu ra văn bản có cấu trúc do bản chép lời trực tiếp tạo ra đóng vai trò là dữ liệu đầu vào quan trọng cho các mô hình ngôn ngữ lớn cung cấp sức mạnh cho các tính năng nâng cao của AI Companion, cho phép các mô hình này phân tích nội dung hội thoại và tạo ra những thông tin chi tiết thông minh.

<figure><img src="/files/9b9de00599c2d09409799b7455fdfb910427f990" alt="" width="563"><figcaption></figcaption></figure>

Tham khảo Trung tâm hỗ trợ của Zoom để biết thêm thông tin về cách bản chép lời trực tiếp cung cấp sức mạnh cho các tính năng như [câu hỏi trong cuộc họp](https://support.zoom.com/hc/en/article?id=zm_kb\&sysparm_article=KB0057749) và [Tóm tắt cuộc họp](https://support.zoom.com/hc/en/article?id=zm_kb\&sysparm_article=KB0057960)của AI Companion, cũng như các tính năng không thuộc AI Companion như [phụ đề tự động](https://support.zoom.com/hc/en/article?id=zm_kb\&sysparm_article=KB0058810).

#### Bản chép lời trực tiếp cục bộ

Từ phiên bản 6.5.3 của ứng dụng Zoom Workplace, người dùng giờ đây có thể truy cập bản chép lời trực tiếp cục bộ trên thiết bị, xử lý âm thanh trực tiếp trên thiết bị của họ thay vì sử dụng xử lý dựa trên đám mây. Mặc dù tùy chọn này được thiết kế để cung cấp quyền riêng tư tốt hơn và độ trễ thấp hơn, nhưng các bản chép lời được tạo thông qua xử lý cục bộ không thể được sử dụng bởi các tính năng AI Companion, vốn cần dữ liệu bản chép lời dựa trên đám mây để hoạt động.

### Dịch trực tiếp (Phụ đề)

Tính năng Dịch trực tiếp của Zoom hoạt động như một phần mở rộng của tính năng bản chép lời trực tiếp, trong đó bản chép lời trực tiếp gốc đóng vai trò là nền tảng cho quá trình dịch. Dữ liệu bản chép lời trực tiếp được truyền từ mô-đun bản chép lời trực tiếp sang mô-đun dịch trực tiếp của Zoom, mô-đun này xử lý bản chép lời bằng ngôn ngữ nguồn được phát hiện và dịch sang ngôn ngữ đích mà người dùng yêu cầu. Các bản chép lời đã dịch sau đó được trả lại cho dịch vụ bản chép lời trực tiếp, dịch vụ này phân phối nội dung đã bản địa hóa tới người tham gia cuộc họp thông qua các ứng dụng Zoom Workplace của họ, cho phép giao tiếp đa ngôn ngữ theo thời gian thực mà không làm gián đoạn dòng chảy tự nhiên của cuộc trò chuyện.

<figure><img src="/files/1be21371954f1ec9ec50e212105de90c43ee3736" alt="" width="375"><figcaption></figcaption></figure>

<figure><img src="/files/5945f1f54e4428726592b1b4a3f16d48334afb46" alt="" width="563"><figcaption></figcaption></figure>

Tham khảo Trung tâm hỗ trợ của Zoom để biết thêm thông tin về [sử dụng phụ đề đã dịch](https://support.zoom.com/hc/en/article?id=zm_kb\&sysparm_article=KB0059081).

### Cô lập âm thanh cá nhân hóa

Cô lập âm thanh cá nhân hóa tận dụng dấu vân tay giọng nói của người dùng để phân biệt giọng nói của họ và giảm Tạp âm nền, ngay cả trong môi trường mở. Người dùng cho phép Zoom tạo một dấu vân tay giọng nói, ghi lại các đặc điểm và sắc thái độc đáo trong mẫu giọng nói của họ. Người dùng cũng có thể chọn tải lên bản ghi âm giọng nói của mình. Dấu vân tay giọng nói của người dùng cho phép Zoom lọc và cô lập thông minh giọng nói của người dùng khỏi âm thanh nền xung quanh được phát hiện bởi micrô của họ. Công nghệ này giảm hiệu quả các âm thanh môi trường như tiếng trò chuyện trong quán cà phê, máy hút bụi, chó sủa hoặc cuộc trò chuyện của những người khác trong phạm vi micrô, giúp đảm bảo rằng chỉ có giọng nói của người dùng được truyền đi nổi bật.

Tham khảo Trung tâm hỗ trợ của Zoom để biết thêm thông tin về [sử dụng cô lập âm thanh cá nhân hóa](https://support.zoom.com/hc/en/article?id=zm_kb\&sysparm_article=KB0074698).


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://library.zoom.com/technical-library/vi/zoom-workplace/artificial-intelligence/artificial-intelligence-bluepaper/algorithms/algorithm-features.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.