# Tổng quan về Trí tuệ nhân tạo tại Zoom

## Trí tuệ nhân tạo tại Zoom: Tổng quan

Trí tuệ nhân tạo đang phát triển nhanh chóng và trở thành một phần không thể thiếu của cuộc sống hằng ngày, hỗ trợ mọi thứ từ các mô hình ngôn ngữ lớn và nhỏ đến các chức năng thuật toán chuyên biệt. Trong khi AI tạo sinh cho phép tương tác liền mạch giữa con người và máy móc để tạo nội dung, giải quyết vấn đề và ra quyết định, AI cũng tồn tại trong các ứng dụng chuyên biệt hơn. Các công cụ tự động hóa giúp tinh giản quy trình làm việc, trong khi các dịch vụ như bản chép lời và dịch thuật phá bỏ các rào cản giao tiếp, giúp cộng tác hiệu quả và dễ tiếp cận hơn. Khi AI tiếp tục tiến bộ, các ứng dụng của nó đang chuyển đổi các ngành bằng cách nâng cao hiệu suất, độ chính xác và đổi mới, về cơ bản định hình lại cách các doanh nghiệp vận hành.

Với vai trò ngày càng mở rộng của AI trong nơi làm việc hiện đại, AI Bluepaper đóng vai trò là hướng dẫn chi tiết về các tính năng AI trong nền tảng Zoom. Bằng cách khám phá một số cách triển khai, chức năng và năng lực AI chủ chốt của Zoom, tài liệu này cung cấp cho doanh nghiệp những hiểu biết cần thiết để khai thác AI một cách hiệu quả—giúp tinh giản quy trình làm việc, tăng cường cộng tác và thúc đẩy năng suất cao hơn trên các nhóm.

### Trí tuệ nhân tạo tác tử: Tối đa hóa sức mạnh tự vận hành, tự chủ của AI

AI tác tử đề cập đến trí tuệ nhân tạo được thiết kế để làm nhiều hơn là chỉ trả lời câu hỏi—nó được xây dựng để hành động thay mặt người dùng. Là một nền tảng làm việc mở ưu tiên AI được xây dựng cho kết nối giữa con người, Zoom đang tích cực phát triển các năng lực AI tác tử để giúp người dùng chuyển từ thông tin sang thực thi một cách liền mạch.

Thay vì dừng lại ở các đề xuất hoặc bản tóm tắt cuộc họp, tầm nhìn cho AI tác tử là phát triển thành một trợ lý tự chủ có thể giúp người dùng quản lý các bước tiếp theo, hoàn thành nhiệm vụ và duy trì quy trình làm việc. Khi công nghệ AI tiếp tục được cải thiện, AI tác tử sẽ ngày càng hoạt động như một trợ lý kỹ thuật số được cá nhân hóa—giúp người dùng duy trì tổ chức, theo sát các ưu tiên và giảm bớt nỗ lực thủ công trong việc chuyển thông tin giữa các cuộc trò chuyện, cuộc họp và công cụ làm việc.

### Zoom AI Companion: Trợ lý nơi làm việc thông minh của bạn

Zoom AI Companion là một trợ lý kỹ thuật số thông minh, có tính hội thoại ở cốt lõi của nền tảng Zoom Workplace, được thiết kế để nâng cao năng suất, tinh giản cộng tác và giảm khối lượng công việc của nhân viên—tất cả đều không phát sinh thêm chi phí cho khách hàng có các dịch vụ trả phí được chọn được gán cho tài khoản người dùng Zoom của họ.

Khi các công cụ AI ngày càng được tích hợp vào lực lượng lao động hiện đại, chúng không còn bị giới hạn trong việc thực hiện các nhiệm vụ cụ thể—như tự động hóa nhập dữ liệu, soạn email, tạo báo cáo hoặc thực hiện các chức năng thuật toán cơ bản. Thay vào đó, các công cụ AI mới nổi đại diện cho một sự chuyển đổi mang tính biến đổi, về cơ bản thay đổi cách chúng ta làm việc. Zoom AI Companion vượt xa việc tự động hóa tác vụ đơn giản; nó có thể đóng vai trò là một người đồng hành thực sự trong công việc hằng ngày của người dùng, có khả năng trả lời các câu hỏi kiến thức chung, tạo nội dung, đưa ra thông tin chuyên sâu, tóm tắt tài liệu, tin nhắn, thư thoại và các cuộc họp, hỗ trợ ra quyết định và giúp người dùng đạt được các mục tiêu mới hoặc mở khóa các cấp độ hiệu suất cao hơn.

Là một công ty ưu tiên AI, Zoom AI Companion được tích hợp một cách cẩn trọng trên toàn bộ bộ sản phẩm của Zoom, bao gồm Zoom Meetings, Trò chuyện, Điện thoại, Trung tâm liên hệ, Tài liệu, Bảng trắng và hơn thế nữa. Khi Zoom tiếp tục đổi mới và mở rộng năng lực của mình, Zoom AI Companion cũng sẽ như vậy, mang đến các tính năng và chức năng mới. Dưới đây là danh sách các tính năng chính hiện có, cho thấy trợ lý AI này có thể giúp nâng cao mọi khía cạnh trong ngày làm việc của người dùng như thế nào.

Các tính năng và chức năng chính hiện tại bao gồm:

| **Danh mục**                              | **Năng lực chính**                                                                                                                | **Giá trị Kinh doanh**                                                      |
| ----------------------------------------- | --------------------------------------------------------------------------------------------------------------------------------- | --------------------------------------------------------------------------- |
| **Không gian làm việc AI tập trung**      | Xử lý truy vấn theo ngữ cảnh, đang lên lịch thông minh, tổng hợp dữ liệu đa nền tảng, theo dõi tiếp theo do AI tạo ra.            | Trung tâm năng suất hợp nhất với tự động hóa quy trình làm việc thông minh. |
| **Thông minh cuộc họp**                   | Hỗ trợ theo thời gian thực trong cuộc họp, lập tài liệu tự động, số liệu phân tích ghi lại thông minh, tự động hóa khâu chuẩn bị. | Nâng cao hiệu quả cuộc họp từ chuẩn bị đến theo dõi thực hiện.              |
| **Tăng cường giao tiếp**                  | Hỗ trợ cuộc trò chuyện thông minh, số liệu phân tích bản chép lời, soạn email, viết dự đoán.                                      | Đẩy nhanh chất lượng giao tiếp trên mọi kênh.                               |
| **Tối ưu hóa Trung tâm liên hệ**          | Phân tích cảm xúc theo thời gian thực, thông minh hội thoại, số liệu phân tích hiệu suất, phản hồi thông minh.                    | Nâng cao trải nghiệm khách hàng với thông tin chuyên sâu do AI thúc đẩy.    |
| **Tạo nội dung**                          | Thông minh tài liệu, tạo nội dung trực quan, công cụ cộng tác, tổ chức phương tiện.                                               | Tinh giản quy trình phát triển nội dung và lên ý tưởng.                     |
| **Quản lý nhiệm vụ & quy trình làm việc** | Tạo nhiệm vụ tự động, Thành phần tích hợp đa nền tảng, công cụ quản lý Sự kiện.                                                   | Giảm gánh nặng hành chính với tự động hóa thông minh.                       |

#### Cách Zoom AI Companion sử dụng sức mạnh của AI tác tử

Zoom AI Companion hiện thực hóa giá trị của AI tác tử bằng cách giúp người dùng dễ dàng biến thông tin thành hành động. Khi AI Companion xác định các nhiệm vụ theo dõi tiếp theo—dù từ một cuộc họp, một tương tác tại Trung tâm liên hệ, hay một thông tin chuyên sâu khác do AI xác định—nó có thể tự động Thêm các mục hành động đó vào Zoom Tasks để theo dõi hoặc phân công. Điều này giúp bảo đảm rằng các bước tiếp theo quan trọng không bị thất lạc trong một tóm tắt cuộc họp hoặc bản tóm tắt cuộc trò chuyện. Thay vào đó, chúng trở thành các nhiệm vụ rõ ràng, có thể theo dõi và có thể được thúc đẩy tiến triển. Bằng cách Kết nối trực tiếp thông tin chuyên sâu với hành động, AI Companion giúp người dùng luôn nắm bắt các ưu tiên, quản lý trách nhiệm và duy trì ngày làm việc mà không có sự cản trở không cần thiết.

### Thuật toán: Cách trí tuệ nhân tạo giúp việc giao tiếp trở nên mượt mà

Ngoài các năng lực LLM thông minh, mang tính hội thoại của Zoom AI Companion, Zoom cũng sử dụng các dịch vụ AI khác (tức là, *thuật toán*) trên toàn nền tảng. Các dịch vụ này thường hoạt động liền mạch trong nền, hỗ trợ các tính năng như bản chép lời giọng nói theo thời gian thực, dịch trực tiếp, khử âm thanh cá nhân và hơn thế nữa.

Cùng nhau, các tính năng này giúp tạo ra một trải nghiệm gắn kết, mượt mà có thể nâng cao cả chất lượng lẫn hiệu quả của mọi tương tác trên nền tảng Zoom. Các tính năng và chức năng dịch vụ AI chính hiện tại bao gồm:

* Bản chép lời
* Dịch thuật
* Phụ đề chi tiết
* Tách biệt âm thanh cá nhân

### Giao thức Ngữ cảnh Mô hình (MCP): Một Tiêu chuẩn để Kết nối AI với Công cụ nhằm Hoàn thành Nhiều Việc hơn

Là một phần trong kiến trúc AI của mình, Zoom sử dụng Giao thức Ngữ cảnh Mô hình (MCP)—một tiêu chuẩn mở cho phép các kết nối an toàn giữa các mô hình, công cụ, nguồn dữ liệu và quy trình làm việc. MCP đóng vai trò then chốt trong việc thúc đẩy AI tác tử bằng cách thay thế nhu cầu về các Thành phần tích hợp đơn lẻ mà mỗi công ty phải xây dựng và duy trì riêng biệt. Thay vào đó, nó cung cấp một khuôn khổ dùng chung, có cấu trúc, giúp bộc lộ các năng lực cho các mô hình AI theo cách nhất quán. Nền tảng này cho phép các hệ thống AI hành động giống như các tác tử thông minh hơn—không chỉ trả lời câu hỏi mà còn trực tiếp thực hiện hành động trong các hệ thống mà người dùng dựa vào. Hiện tại, Zoom hỗ trợ MCP như một phần của tiện ích mở rộng Custom AI Companion, cho phép các tổ chức xây dựng các tác tử tùy chỉnh Kết nối với những nguồn dữ liệu và ứng dụng riêng biệt của họ, tự động hóa các quy trình làm việc thường lệ và cung cấp các phản hồi phù hợp, chính xác dựa trên nội dung làm việc thực tế của các nhóm.

#### Cách MCP hoạt động trong thực tế

Về cốt lõi, MCP được xây dựng trên mô hình khách–máy chủ. Hãy hình dung môi trường AI (như ChatGPT hoặc Claude) như một máy khách muốn hoàn thành công việc, và các hệ thống bên ngoài (như Jira, Confluence hoặc cơ sở dữ liệu) là các máy chủ công bố những gì chúng có thể làm. Mỗi máy chủ cung cấp một danh sách chức năng rõ ràng—như “tìm kiếm cơ sở kiến thức” hoặc “tạo nhiệm vụ”. Sau đó, máy khách AI sẽ quyết định, ngay trong cuộc trò chuyện, khi nào và cách sử dụng các chức năng đó.

Nói cách khác, Kết nối AI với một máy chủ MCP cũng giống như gọi món tại nhà hàng. Bạn (AI) bước vào một nhà hàng, nhận thực đơn (danh sách các dịch vụ hoặc chức năng có sẵn qua máy chủ MCP), và bạn (AI) cho biết mình muốn gì, rồi hệ thống phản hồi. Không có sự phỏng đoán về việc điều gì có hoặc không có—mọi thứ đều được cung cấp sẵn trong thực đơn ngay từ đầu.

Các phần sau đây cung cấp thêm chi tiết về cách MCP hoạt động:

#### <mark style="color:xanh dương;">Bước 1: Hiển thị năng lực thông qua máy chủ</mark>

Bất kỳ hệ thống nào cũng có thể chạy một máy chủ MCP. Máy chủ đó hoạt động như “menu”, công bố một mô tả có cấu trúc về các hành động mà nó hỗ trợ. Ví dụ, Jira có thể công bố các chức năng như “tìm kiếm vấn đề” hoặc “cập nhật ticket”. Vì các chức năng này tuân theo định dạng chia sẻ của MCP, AI có thể hiểu chúng ngay lập tức mà không cần kỹ thuật tùy chỉnh.

#### <mark style="color:xanh dương;">Bước 2: AI Hoạt động như một Client</mark>

Ở phía bên kia, môi trường AI đóng vai trò của client. Nó đọc menu các chức năng đang Đang rảnh, ghi nhớ chúng và quyết định chức năng nào sẽ gọi khi phản hồi người dùng. Điều này có nghĩa là AI không cần được lập trình sẵn với hàng nghìn tích hợp có thể có — nó chỉ đơn giản học những gì có sẵn khi kết nối được thiết lập.

#### <mark style="color:xanh dương;">Bước 3: Truyền ngữ cảnh một cách an toàn</mark>

MCP cũng xác định cách ngữ cảnh và Quyền được truyền đi. Điều này giúp đảm bảo rằng khi AI sử dụng một chức năng, nó chỉ làm như vậy trong phạm vi mà người dùng được Truy cập. Ví dụ, nếu một người dùng có Quyền chỉ xem các ticket Jira của nhóm mình, MCP đảm bảo AI tôn trọng phạm vi đó. Lớp bảo mật này là điều khiến MCP trở nên thực tế cho mục đích Doanh nghiệp lớn, nơi dữ liệu nhạy cảm và kiểm soát Truy cập là không thể thỏa hiệp.

#### <mark style="color:xanh dương;">Vì sao MCP quan trọng</mark>

Bằng cách chuẩn hóa cách AI kết nối với các hệ thống bên ngoài, MCP loại bỏ sự cản trở của các tích hợp tùy chỉnh và đảm bảo an toàn cũng như tính nhất quán. Người dùng được hưởng lợi vì AI không chỉ có thể trả lời câu hỏi mà còn có thể thực hiện các hành động có hiểu biết trên nhiều công cụ khác nhau theo cách liền mạch và an toàn.

### Giao thức Agent-to-Agent (A2A): Cách các Trợ lý AI giao tiếp với nhau

Ngoài MCP, Zoom cũng sẽ sử dụng Giao thức Agent-to-Agent (A2A) như một ngôn ngữ chung cho sự cộng tác giữa các tác nhân tự chủ. A2A là một tiêu chuẩn mở cho phép các tác nhân AI — có thể được xây dựng bởi các nhà cung cấp khác nhau hoặc chạy trong các môi trường khác nhau — khám phá lẫn nhau, chia sẻ ngữ cảnh, giao nhiệm vụ và trao đổi kết quả một cách an toàn. Zoom dự định Hỗ trợ các tác nhân AI bên thứ ba với AI Companion bằng cách sử dụng A2A để lấy ngữ cảnh từ các cuộc trò chuyện Zoom của bạn và thực hiện hành động trên các ứng dụng Kinh doanh khác thay cho bạn. (Tác nhân bên thứ ba cho ServiceNow Now Assist sắp ra mắt.)

Nếu Giao thức Model Context Protocol (MCP) kết nối các mô hình AI với các công cụ và dữ liệu chúng cần, thì A2A kết nối các tác nhân với nhau. Cùng nhau, hai tiêu chuẩn này tạo thành xương sống của các hệ thống đa tác nhân có khả năng tương tác, nơi trí thông minh không bị giới hạn trong một mô hình mà được phân bổ trên một mạng lưới các tác nhân cộng tác.

#### A2A hoạt động trong thực tế như thế nào

Về cốt lõi, A2A được xây dựng trên ý tưởng rằng mỗi tác nhân có thể hoạt động như cả client lẫn server. Một tác nhân có thể yêu cầu trợ giúp hoặc giao phó một nhiệm vụ, trong khi tác nhân khác có thể phản hồi và thực thi nhiệm vụ đó. Việc giao tiếp giữa chúng tuân theo một cấu trúc chung và mô hình bảo mật, vì vậy bất kể ai xây dựng các tác nhân — hay chúng chạy ở đâu — chúng đều có thể hiểu nhau.

Bạn có thể hình dung nó như một nhóm các chuyên gia làm việc cùng nhau: mỗi tác nhân có một công việc rõ ràng, một bản lý lịch mô tả những gì nó có thể làm, và một cách chung để chuyển giao công việc cho người khác.

Các phần sau đây mô tả quy trình này từng bước một:

#### <mark style="color:xanh dương;">Bước 1: Các tác nhân công bố khả năng của mình</mark>

Mỗi tác nhân tương thích A2A đều cung cấp một “Agent Card” nhỏ, có cấu trúc. Thẻ này hoạt động như danh tính và hồ sơ năng lực của tác nhân — nó liệt kê những gì tác nhân có thể làm (ví dụ: “tóm tắt văn bản”, “Lên lịch cuộc họp”, hoặc “truy vấn dữ liệu”), những định dạng mà nó hỗ trợ, và cách có thể liên hệ với nó.

Vì thẻ này tuân theo tiêu chuẩn A2A, bất kỳ tác nhân nào khác cũng có thể đọc nó và ngay lập tức hiểu cách tương tác mà không cần mã tùy chỉnh hay cấu hình đặc biệt.

#### <mark style="color:xanh dương;">Bước 2: Các tác nhân khám phá và kết nối</mark>

Khi một tác nhân muốn cộng tác, nó tìm Agent Card của một tác nhân khác — thường thông qua thư mục, sổ đăng ký hoặc một điểm cuối đã biết — và thiết lập một kết nối an toàn. Quy trình này cho phép các tác nhân tìm thấy nhau một cách linh hoạt, ngay cả khi chúng được xây dựng bởi các nhóm hoặc tổ chức khác nhau.

Khả năng khám phá đảm bảo tính linh hoạt: một tác nhân lập kế hoạch nhiệm vụ có thể tìm thấy một tác nhân trực quan hóa, hoặc một tác nhân Hỗ trợ khách hàng có thể xác định vị trí một tác nhân dịch thuật, tất cả thông qua các cơ chế khám phá tiêu chuẩn.

#### <mark style="color:xanh dương;">Bước 3: Các tác nhân trao đổi nhiệm vụ và kết quả</mark>

Sau khi kết nối, các tác nhân giao tiếp thông qua các thông điệp nhiệm vụ được chuẩn hóa.\
Một thông điệp nhiệm vụ có thể bao gồm một yêu cầu (“phân tích bộ dữ liệu này”) và một phản hồi (“đây là các thông tin chi tiết”). Những trao đổi này có thể diễn ra đồng bộ cho các thao tác nhanh hoặc bất đồng bộ cho các nhiệm vụ kéo dài hơn.

A2A cũng Hỗ trợ phát trực tuyến và thông báo, vì vậy các tác nhân có thể gửi cập nhật trung gian hoặc kết quả một phần trong khi làm việc — phản ánh cách con người có thể cộng tác theo thời gian thực.

#### <mark style="color:xanh dương;">Bước 4: Cộng tác an toàn và chia sẻ ngữ cảnh</mark>

Mỗi tương tác giữa các tác nhân đều được xác thực và giới hạn phạm vi bởi người dùng hoặc hệ thống đã khởi tạo nó, đảm bảo các tác nhân chỉ Truy cập dữ liệu hoặc khả năng mà họ được phép sử dụng.

Việc trao đổi ngữ cảnh có kiểm soát này cho phép các quy trình làm việc phức tạp — như một tác nhân tóm tắt một tài liệu trong khi tác nhân khác tạo một hành động theo dõi — mà không làm rò rỉ thông tin.

#### <mark style="color:xanh dương;">Vì sao A2A quan trọng</mark>

Bằng cách xác định một cách phổ quát để các tác nhân nói chuyện với nhau, A2A mở khóa một lớp mới về khả năng tương tác và khả năng ghép nối. Thay vì xây dựng các tác nhân khổng lồ, nguyên khối cố gắng làm mọi thứ, A2A trao quyền cho các tổ chức thiết kế các tác nhân chuyên biệt — mỗi tác nhân tập trung vào một lĩnh vực cụ thể — và để chúng cộng tác thông qua một giao thức chung.

Đối với Doanh nghiệp lớn, điều này có nghĩa là:

* Khả năng tương thích đa nhà cung cấp: Các tác nhân từ những nhà cung cấp khác nhau có thể tương tác an toàn.
* Thiết kế có khả năng mở rộng: Các nhóm có thể Thêm hoặc thay thế tác nhân mà không cần tái kiến trúc toàn bộ hệ thống.
* Tự động hóa được quản trị: Bảo mật, khả năng quan sát và kiểm toán được chuẩn hóa ngay từ đầu.
* Đổi mới nhanh hơn: Các khả năng mới có thể được giới thiệu chỉ bằng cách công bố một Agent Card mới — không cần đi lại dây các tích hợp hiện có.
