elle-quach

・

05/08/2025

Làm chủ AI Agents quy mô doanh nghiệp: Triển khai an toàn và tối ưu

AI Agents – Bước ngoặt thay đổi cách chúng ta làm việc và sinh sống

Tại OSAM, chúng tôi tin rằng AI Agents (tác nhân AI) sẽ là cuộc cách mạng công nghệ tiếp theo, mang tính đột phá không kém gì sự ra đời của Internet. Tầm nhìn này cũng được khẳng định bởi Matt Garman – Giám đốc điều hành AWS – người nhấn mạnh rằng các hệ thống tác nhân thông minh đang bắt đầu giải quyết những vấn đề phức tạp, tự động hóa quy trình làm việc và mở ra khả năng hoàn toàn mới cho nhiều ngành nghề.

Những ví dụ tiên phong đã chứng minh tiềm năng đó:

AstraZeneca đẩy nhanh khám phá thông tin chuyên sâu trong chăm sóc sức khỏe.
Yahoo Finance tái định nghĩa cách nghiên cứu tài chính phục vụ hàng triệu nhà đầu tư.
Syngenta cách mạng hóa ngành nông nghiệp với mô hình canh tác chính xác dựa trên AI.

Tuy nhiên, để nhân rộng các thành công này thành ứng dụng thực tiễn ở quy mô lớn, các tổ chức cần một phương pháp tiếp cận thực tế – vừa tận dụng sức mạnh AI Agents, vừa kiểm soát được sự phức tạp vốn có của chúng.

AWS AI Stack: Nền tảng toàn diện để xây dựng và triển khai các hệ thống AI agentic sẵn sàng đưa vào sản xuất ở quy mô lớn.

Hình1: Nền tảng toàn diện để xây dựng và triển khai các hệ thống AI đại lý sẵn sàng đưa vào sản xuất ở quy mô lớn

Nguyên tắc định hướng, tối ưu cho AI Agents

Nguyên tắc 1: Coi sự nhanh nhẹn là lợi thế cạnh tranh

Những tổ chức phát triển mạnh mẽ không phải là những tổ chức dự đoán tương lai một cách hoàn hảo, mà là những tổ chức thích ứng nhanh chóng với những thay đổi. Để duy trì sự linh hoạt, cần một kiến trúc agentic, đề cao tính linh hoạt và cởi mở thay vì các khuôn khổ cứng nhắc hay mô hình đơn lẻ. Điều này có nghĩa là xây dựng các hệ thống có thể tích hợp các mô hình mới khi chúng xuất hiện, kết nối với các nguồn dữ liệu độc quyền của bạn và tích hợp liền mạch với các công cụ hiện có.

Nhu cầu kép về tính ổn định và khả năng thích ứng đã dẫn dắt chúng tôi tạo ra Amazon Bedrock AgentCore , một bộ dịch vụ hoàn chỉnh để triển khai và vận hành các tác nhân có năng lực cao một cách an toàn ở quy mô doanh nghiệp. AgentCore cung cấp thời gian chạy không máy chủ an toàn với khả năng cô lập phiên hoàn toàn và khối lượng công việc chạy lâu nhất hiện nay, các công cụ và khả năng giúp các tác nhân thực hiện quy trình công việc với các quyền và ngữ cảnh phù hợp, cũng như các biện pháp kiểm soát để vận hành các tác nhân đáng tin cậy. Các khả năng của nó có thể được sử dụng cùng nhau hoặc độc lập và hoạt động với các khuôn khổ nguồn mở phổ biến như CrewAI, LangGraph, LlamaIndex và Strands Agents và với bất kỳ mô hình nào bao gồm cả những mô hình trong (hoặc ngoài) Amazon Bedrock , do đó các nhà phát triển có thể duy trì sự linh hoạt khi công nghệ thay đổi. Bằng cách giảm bớt khối lượng công việc nặng không phân biệt, AgentCore giúp các tổ chức vượt ra ngoài các thử nghiệm để đến các hệ thống tác nhân sẵn sàng sản xuất có thể được tin cậy với các quy trình kinh doanh quan trọng nhất của bạn.

Các khách hàng như Itaú Unibanco , Innovaccer , Boomi , Box và Epsilon đã và đang thử nghiệm AgentCore và rất hào hứng với việc nó giúp họ triển khai agent nhanh chóng vào môi trường sản xuất. Những người dùng đầu tiên này nhận thấy AgentCore giúp loại bỏ sự đánh đổi giữa tính linh hoạt của mã nguồn mở và tính bảo mật, độ tin cậy cấp doanh nghiệp, cho phép họ tập trung vào việc tạo ra giá trị kinh doanh thay vì xây dựng nền tảng bảo mật và vận hành từ đầu.

Nguyên tắc 2: Phát triển các nguyên tắc cơ bản của AI Agents cho kỷ nguyên đại lý

Mặc dù các nguyên tắc cốt lõi của công nghệ doanh nghiệp vẫn không thay đổi, nhưng cách chúng ta triển khai chúng phải thay đổi để phù hợp với kỷ nguyên đại lý. Những nền tảng tiên tiến này tạo nên nền tảng cho phép các đại lý đạt đến trình độ sản xuất thực tế:

Bảo mật và Tin cậy. Các tác nhân (agent) đưa ra những cân nhắc bảo mật mới khi chúng vượt qua ranh giới hệ thống, thực hiện hành động thay mặt người dùng hoặc tự hành động với sự đồng ý trước của người dùng. Sự tin cậy đòi hỏi tính minh bạch, các rào cản và xác minh. AgentCore Runtime giúp giải quyết những vấn đề này với môi trường tính toán chuyên dụng cho mỗi phiên và khả năng cô lập bộ nhớ, giúp ngăn chặn rò rỉ dữ liệu giữa các tác nhân, dựa trên một thập kỷ đổi mới không cần máy chủ của AWS Lambda về bảo mật và khả năng mở rộng.
Độ tin cậy và khả năng mở rộng . Các phương pháp tiếp cận truyền thống để mở rộng quy mô phần mềm không đáp ứng được yêu cầu của hệ thống agentic vì chúng tuân theo các đường dẫn thực thi không thể đoán trước và yêu cầu tài nguyên thay đổi trong các tương tác. AgentCore Runtime có độ tin cậy cao với khả năng kiểm tra điểm kiểm tra và khôi phục, giúp đảm bảo khôi phục nhanh chóng trong trường hợp gián đoạn và lỗi bất ngờ. Hệ thống có thể tự động xử lý việc mở rộng quy mô từ 0 đến hàng nghìn phiên đồng thời, loại bỏ việc lập kế hoạch năng lực và bảo trì cơ sở hạ tầng.
Nhận dạng . Khi các tác nhân hoạt động thay mặt cho người dùng và hệ thống, các mô hình nhận dạng truyền thống phải phát triển. Việc quản lý quyền của cả tác nhân và người dùng khi các tác nhân điều hướng các quy trình làm việc phức tạp trải rộng trên nhiều hệ thống trở nên rất quan trọng để bảo mật dữ liệu của bạn. AgentCore Identity cung cấp quyền truy cập tác nhân an toàn trên các dịch vụ AWS và các ứng dụng và công cụ của bên thứ ba với các quyền tạm thời, chi tiết và xác thực dựa trên tiêu chuẩn. Giải pháp này tương thích với các nhà cung cấp danh tính hàng đầu như Amazon Cognito, Microsoft Entra ID và Okta, cũng như các nhà cung cấp OAuth phổ biến như GitHub, Google, Salesforce và Slack.
Khả năng quan sát . Việc hiểu các quyết định của tác nhân đòi hỏi những cách tiếp cận mới trong giám sát. Khả năng quan sát trở nên thiết yếu không chỉ trong việc khắc phục sự cố mà còn cho việc tuân thủ và cải tiến liên tục, thể hiện sự chuyển đổi từ kiểm toán định kỳ sang giám sát liên tục. AgentCore Observability cung cấp khả năng hiển thị theo thời gian thực thông qua bảng điều khiển tích hợp và dữ liệu đo từ xa được tiêu chuẩn hóa, tích hợp với ngăn xếp giám sát của bạn.
Dữ liệu . Dữ liệu độc quyền của bạn giờ đây có giá trị hơn bao giờ hết, cho phép các tác nhân hiểu rõ bối cảnh cụ thể của bạn. Khả năng truy cập, xử lý và học hỏi từ dữ liệu này một cách an toàn trở thành một yếu tố quan trọng tạo nên sự khác biệt về hiệu suất và mức độ liên quan của tác nhân. Ví dụ: với AgentCore Gateway, bạn có thể chuyển đổi các nguồn dữ liệu, bao gồm cả Cơ sở tri thức Amazon Bedrock, thành các công cụ tương thích với tác nhân để tác nhân có thể truy cập thông tin mới nhất và liên quan.
Tích hợp liền mạch . Các tác nhân phải làm việc với mọi thứ trong môi trường của bạn: hệ thống của bạn, các đám mây khác, các ứng dụng SaaS và các tác nhân khác. AgentCore Gateway giúp điều đó trở nên khả thi bằng cách chuyển đổi API và dịch vụ thành các công cụ tương thích với tác nhân với mã tối thiểu, loại bỏ nhiều tháng làm việc tích hợp trong khi cho phép các tác nhân khám phá và tương tác với hệ thống của bạn. SDK Strands Agents nguồn mở của chúng tôi bổ sung điều này bằng các mẫu phối hợp linh hoạt và hỗ trợ MCP và A2A để cho phép phối hợp liền mạch giữa nhiều tác nhân và công cụ trên các môi trường khác nhau. AWS API MCP Server cung cấp cho các tác nhân một giao diện có thể gọi tới các dịch vụ AWS, cho phép các mô hình nền tảng khám phá các hoạt động khả dụng, lý giải các yêu cầu đầu vào và đầu ra và tạo các kế hoạch gọi API AWS để khám phá, cấu hình hoặc quản lý tài nguyên với các khả năng AWS thời gian thực vượt quá ngưỡng đào tạo mô hình.
Công cụ và Khả năng . Các tác nhân cần các công cụ chuyên dụng để thực hiện các tác vụ phức tạp và duy trì ngữ cảnh trong suốt các tương tác. AgentCore Memory giúp các nhà phát triển dễ dàng xây dựng các tác nhân nhận biết ngữ cảnh bằng cách loại bỏ việc quản lý cơ sở hạ tầng bộ nhớ phức tạp trong khi vẫn cung cấp toàn quyền kiểm soát những gì tác nhân AI ghi nhớ. Nó cung cấp độ chính xác hàng đầu trong ngành cùng với hỗ trợ cho cả bộ nhớ ngắn hạn cho các cuộc hội thoại nhiều lượt và bộ nhớ dài hạn tồn tại trong các phiên, với khả năng chia sẻ kho lưu trữ bộ nhớ giữa các tác nhân cộng tác. Các công cụ tích hợp bao gồm AgentCore Browser cho các tương tác web, cho phép các tác nhân điều hướng các trang web và thực hiện các hành động thay mặt bạn và AgentCore Code Interpreter để thực thi mã một cách an toàn, cho phép các tác nhân xử lý dữ liệu, tạo hình ảnh trực quan và giải quyết các vấn đề phức tạp theo chương trình. Các khả năng này mở rộng những gì các tác nhân có thể làm trong khi vẫn duy trì tính bảo mật và độ tin cậy.

Cùng nhau, những nền tảng tiên tiến này giúp các tổ chức xây dựng kiến trúc tác nhân an toàn, đáng tin cậy và có khả năng mở rộng, mang lại kết quả nhất quán trong môi trường sản xuất. Với AgentCore, chúng tôi giúp khách hàng tập trung vào việc tạo ra giá trị thay vì tái tạo cơ sở hạ tầng.

Nguyên tắc 3: Mang lại kết quả vượt trội với sự lựa chọn mô hình và dữ liệu từ AI Agents

Cốt lõi của mọi hệ thống tác nhân hiệu quả nằm ở mô hình nền tảng, hỗ trợ khả năng hiểu, suy luận và hành động của tác nhân. Để các tác nhân mang lại trải nghiệm mang tính đột phá, các mô hình được lựa chọn cẩn thận và có khả năng tùy chỉnh cần tương tác với kiến thức phong phú, cụ thể theo ngữ cảnh, quyết định mức độ hiệu quả của mô hình trong việc đưa ra quyết định thay mặt bạn. Thực tế này áp dụng cho tất cả các ứng dụng AI, đó là lý do tại sao AWS mang đến cho khách hàng sự tự do lựa chọn mô hình tối ưu cho từng trường hợp sử dụng và các công cụ để nâng cao các mô hình đó bằng dữ liệu riêng của chúng. Phương pháp này mang lại kết quả vượt trội và hiệu suất giá tốt nhất cho tất cả các triển khai AI.

Yêu cầu về mô hình rất đa dạng—một số ứng dụng đòi hỏi khả năng lập luận phức tạp, số khác lại yêu cầu phản hồi nhanh, và nhiều ứng dụng ưu tiên hiệu quả chi phí theo quy mô. Không có mô hình nào vượt trội trên mọi phương diện, đó là lý do tại sao chúng tôi tiên phong trong việc lựa chọn mô hình với Amazon Bedrock vào năm 2023. Nhưng điểm khác biệt thực sự nằm ở cách bạn kết hợp các mô hình với dữ liệu độc quyền của tổ chức, biến AI chung thành các hệ thống có chuyên môn sâu về lĩnh vực.

Để giúp bạn tạo ra các mô hình với trình độ chuyên môn cao này, hôm nay chúng tôi đang mở rộng khả năng tùy chỉnh mô hình của mình với việc ra mắt tùy chỉnh Amazon Nova trong Amazon SageMaker AI . Các mô hình Nova hiện cung cấp cho khách hàng sự linh hoạt để tùy chỉnh mô hình trong suốt vòng đời phát triển mô hình. Điều này bao gồm tiền đào tạo và hậu đào tạo, bao gồm cả tinh chỉnh và căn chỉnh, với hỗ trợ tinh chỉnh hiệu quả tham số (PEFT) và tinh chỉnh hoàn toàn. Với những điều này, Nova hiện cung cấp bộ khả năng tùy chỉnh mô hình toàn diện nhất có sẵn cho bất kỳ họ mô hình độc quyền nào. Sử dụng các kỹ thuật bao gồm Tinh chỉnh có giám sát (SFT), Tối ưu hóa tùy chọn trực tiếp (DPO), học tăng cường từ phản hồi của con người bằng Tối ưu hóa chính sách gần (PPO), Đào tạo trước liên tục (CPT) và Chưng cất kiến thức, khách hàng có thể tạo các mô hình Nova được tối ưu hóa cho trường hợp sử dụng của họ. Sau khi tùy chỉnh, các mô hình này có thể được triển khai trực tiếp vào Amazon Bedrock, cho phép bạn tích hợp liền mạch các mô hình tùy chỉnh của mình vào hệ thống tác nhân và các ứng dụng AI khác.

Chúng tôi cũng đang đào tạo các mô hình riêng được tối ưu hóa cho các trường hợp sử dụng tác nhân cụ thể. Nova Act là một mô hình AI được đào tạo để thực hiện các hành động trong trình duyệt web. Khách hàng có thể bắt đầu xây dựng các tác nhân tự động hóa trình duyệt của riêng mình với Nova Act SDK , được thiết kế riêng để cho phép các tác nhân trình duyệt đáng tin cậy được hỗ trợ bởi mô hình Nova Act. Nova Act SDK, hiện có sẵn trong bản xem trước nghiên cứu, sử dụng AgentCore Browser để thực thi trình duyệt dựa trên đám mây, có thể mở rộng quy mô.

Khi đã có mô hình phù hợp, bạn cần đảm bảo mô hình đó có thể tương tác với dữ liệu độc quyền và hiện tại của tổ chức. Các vectơ đã nổi lên như một cách chủ đạo và nhanh nhất để các mô hình AI có thể truy cập dữ liệu của bạn. Cho đến nay, chi phí lưu trữ các nhúng vectơ – chìa khóa để kích hoạt trí thông minh này – đã buộc các tổ chức phải giới hạn hệ thống AI của họ chỉ ở dữ liệu gần đây, hạn chế tiềm năng của chúng. Việc ra mắt Amazon S3 Vectors hôm nay , kho lưu trữ đối tượng đám mây đầu tiên có hỗ trợ vectơ gốc, đánh dấu một sự thay đổi cơ bản. Bằng cách giảm 90% chi phí lưu trữ vectơ trong khi vẫn duy trì hiệu suất truy vấn dưới một giây, S3 Vectors cho phép các tác nhân ghi nhớ nhiều hơn, suy luận sâu hơn và duy trì ngữ cảnh toàn diện từ mọi tương tác với khách hàng, tài liệu và thông tin chi tiết về doanh nghiệp. S3 Vectors tích hợp trực tiếp với Cơ sở kiến thức Amazon Bedrock cho các ứng dụng RAG tiết kiệm chi phí và Dịch vụ Amazon OpenSearch cho các chiến lược vectơ theo tầng.

Nguyên tắc 4: Triển khai các giải pháp chuyển đổi trải nghiệm trên AI Agents

Trong khi các mô hình và cơ sở hạ tầng thay đổi cách thức xây dựng của các tổ chức, các giải pháp agentic chuyển đổi cách thức vận hành của doanh nghiệp. Sức mạnh thực sự của AI agentic nằm ở khả năng định hình lại quy trình làm việc và năng suất của con người trên toàn bộ các ngành. Những giải pháp này giải phóng con người khỏi các công việc thường ngày và xử lý các luồng thông tin phức tạp, cho phép các nhóm tập trung vào tư duy sáng tạo và các quyết định chiến lược. Chúng tôi đang giúp quá trình chuyển đổi này dễ dàng tiếp cận hơn với nhiều tổ chức hơn thông qua các giải pháp agentic được xây dựng sẵn. Bằng cách kết hợp các khối xây dựng nền tảng với các giải pháp được xây dựng sẵn, bạn có thể vượt ra ngoài các thử nghiệm để tiến tới các chiến lược AI toàn diện mang lại tác động kinh doanh hữu hình.

Hôm nay, chúng tôi xin thông báo rằng giờ đây bạn có thể mua các tác nhân và công cụ AI trên AWS Marketplace , với quy trình mua sắm hợp lý và nhiều tùy chọn triển khai. Trong bối cảnh AI phân mảnh hiện nay, AWS Marketplace cung cấp một danh mục tập trung các tác nhân, công cụ và giải pháp được tuyển chọn kỹ lưỡng từ các Đối tác AWS. Tự động hóa nhanh chóng với các tác nhân được xây dựng sẵn từ các Đối tác AWS. Phương pháp triển khai dựa trên API mới của chúng tôi giúp bạn hợp lý hóa việc tích hợp với các tác nhân và công cụ khác hỗ trợ MCP và A2A. Các tác nhân này có thể chạy trên các dịch vụ AWS đáng tin cậy hoặc trong môi trường AWS của bạn, nơi bạn duy trì quyền kiểm soát bảo mật và quyền truy cập. Bạn có thể triển khai một số tác nhân và công cụ được xây dựng sẵn trên AgentCore.

Chúng tôi cũng đang tiếp tục cung cấp cho khách hàng các giải pháp tác nhân sẵn sàng triển khai, cho phép thực hiện chuyển đổi này. Kiro là một IDE AI giúp các nhà phát triển chuyển từ ý tưởng sang sản xuất với quy trình phát triển theo đặc tả. Từ các tác vụ đơn giản đến phức tạp, Kiro đồng hành cùng bạn để biến lời nhắc thành các đặc tả chi tiết—sau đó thành mã hoạt động, tài liệu và bài kiểm tra. Vì vậy, những gì bạn xây dựng chính xác là những gì bạn muốn và sẵn sàng chia sẻ với nhóm của mình. Các tác nhân của Kiro giúp bạn giải quyết các vấn đề khó khăn và tự động hóa các tác vụ như tạo tài liệu và kiểm tra đơn vị. Với Kiro , bạn có thể xây dựng vượt ra ngoài các nguyên mẫu trong khi vẫn nắm quyền kiểm soát mọi bước. AWS Transform triển khai các tác nhân AI chuyên biệt để tự động hóa các tác vụ hiện đại hóa phức tạp như phân tích mã, tái cấu trúc và lập bản đồ phụ thuộc, giúp giảm đáng kể thời gian dự án cho việc di chuyển khối lượng công việc của doanh nghiệp. Mỗi giải pháp đều thể hiện cam kết của chúng tôi về tính linh hoạt và sự lựa chọn, giúp bạn đổi mới nhanh hơn và hiện thực hóa kết quả kinh doanh sớm hơn. Và Amazon Connect , một giải pháp trải nghiệm khách hàng toàn diện, cho phép các tổ chức làm hài lòng khách hàng của mình với AI không giới hạn trong mọi tương tác với khách hàng trên tất cả các kênh.

Bốn nguyên tắc này định hướng chiến lược sản phẩm của chúng tôi và được tích hợp trong mọi cải tiến mà chúng tôi công bố hôm nay: áp dụng tính linh hoạt, phát triển nền tảng, kết hợp lựa chọn mô hình với dữ liệu độc quyền và triển khai các giải pháp mang tính chuyển đổi. Cùng nhau, chúng tạo nên một khuôn khổ toàn diện để triển khai thành công AI agentic trong tổ chức của bạn.

ĐỊNH HÌNH DOANH NGHIỆP CÙNG AI AGENTS

Tiềm năng to lớn của khách hàng và các doanh nghiệp đa dạng của chúng tôi đã thôi thúc chúng tôi tập trung vào việc xây dựng những năng lực AI đáng tin cậy nhất trên hành tinh. Nhưng lời khuyên quan trọng nhất tôi có thể đưa ra rất đơn giản: hãy bắt đầu ngay bây giờ.

ĐỊNH HÌNH DOANH NGHIỆP CÙNG AI AGENT

👉 Liên hệ với OSAM đối tác của AWS để bắt đầu hành trình triển khai AI Agents cho doanh nghiệp bạn!

Tìm hiểu thêm về dịch vụ:

http://18.140.63.179/autonomous-agents/

http://18.140.63.179/chien-luoc-toi-uu-hoa-chi-phi-hieu-qua-cho-amazon-bedrock/