Claude Opus 4.5 chính thức có mặt trên Amazon Bedrock

Anthropic vừa công bố mô hình nền tảng mới nhất Claude Opus 4.5, nay đã chính thức có mặt trên Amazon Bedrock, nền tảng dịch vụ được quản lý hoàn toàn cho phép lựa chọn các mô hình nền tảng hiệu năng cao từ những công ty AI hàng đầu. Claude Opus 4.5 đánh dấu một bước tiến đáng kể trong năng lực của AI, thiết lập tiêu chuẩn mới về lập trình, agents và các tác vụ văn phòng. Mô hình này được đánh giá là vượt trội hơn Sonnet 4.5 và Claude Opus 4.1, đồng thời cung cấp chất lượng tương đương Claude Opus với chỉ với 1/3 chi phí.

Hãy cùng OSAM tìm hiểu những khác biệt của Claude Opus 4.5, các ứng dụng trong doanh nghiệp vàcách sử dụng các tính năng mới trong công cụ trên Amazon Bedrock. 

Những điểm nổi bật của Claude Opus 4.5

Claude Opus 4.5 là mô hình tiên tiến nhất trong dòng Opus của Anthropic, được thiết kế dành cho nhà phát triển đang xây dựng AI agents có khả năng lập luận, lập kế hoạch và thực hiện các tác vụ phức tạp mà không cần giám sát nghiêm ngặt. Mô hình nâng cấp Sonnet 4.5, cải thiện hiệu năng ở các trường hợp sử dụng hiện tại và bổ sung các khả năng mới cho quy trình phức tạp.

 

claude-opus-4-5

Mô hình này đặc biệt xuất sắc trong lĩnh vực kỹ thuật phần mềm chuyên nghiệp, đạt 80,9% trên SWE-bench Verified, giúp rút ngắn những dự án phát triển kéo dài nhiều ngày xuống chỉ còn vài giờ. Claude Opus 4.5 có thể hoạt động độc lập với khả năng lập trình đa ngôn ngữ vượt trội, đồng thời cải thiện hiệu suất tạo mã, độ phủ kiểm thử và khả năng xây dựng kiến trúc rõ ràng, hợp lý.

Đối với các tác vụ văn phòng, Claude Opus 4.5 có thể xử lý các dự án phức tạp hoàn chỉnh. Nó có thể tạo các slide PowerPoint, bảng tính trên Excel và tài liệu Word chuyên nghiệp, bao gồm chỉnh sửa và rà soát hợp đồng, NDA và nhiều nội dung phức tạp khác.

Mô hình cũng tạo ra các sản phẩm React và HTML chất lượng cao hơn, duy trì tính nhất quán và độ chính xác – điều vô cùng quan trọng đối với ngành tài chính và các lĩnh vực yêu cầu chính xác cao. Claude Opus 4.5 có khả năng ghi nhớ và duy trì ngữ cảnh trên nhiều tệp trong các dự án dài hạn.

Đây cũng là mô hình thị giác tốt nhất của Anthropic tính đến thời điểm hiện tại, đạt 80,7% trên MMMU, giúp mô hình có khả năng xử lý các quy trình đòi hỏi diễn giải hình ảnh phức tạp và điều hướng đa bước, chẳng hạn như phân tích mockup thiết kế, xử lý tài liệu bố cục phức tạp và tự động hóa các tác vụ trên trình duyệt với khả năng điều khiển máy tính vượt trội hơn.

Mô hình Claude Opus 4.5 giới thiệu 2 cải tiến quan trọng dành cho nhà phát triển agents:

  • Tool Search: cho phép agents sử dụng hàng trăm công cụ bằng cách tự động phát hiện và tải đúng công cụ cần thiết, thay vì tải toàn bộ – giúp tiết kiệm hàng chục nghìn token và ngăn chặn xung đột schema khi thư viện công cụ lớn.
  • Tool Use Examples: cho phép cung cấp ví dụ gọi công cụ trực tiếp trong phần định nghĩa công cụ, giúp tăng độ chính xác đối với các schema phức tạp có nested object hoặc mảng.

claude-opus-4.5-performance-benchmarks

Ứng dụng Claude Opus 4.5 trong doanh nghiệp

  • Phát triển phần mềm: Xây dựng agents có khả năng viết và tái cấu trúc mã ở quy mô toàn dự án, quản lý kiến trúc full-stack hoặc thiết kế hệ thống agents phá nhỏ mục tiêu thành các bước có thể thực thi. Claude Opus 4.5 có thể phân tích tài liệu kỹ thuật, lập kế hoạch triển khai, viết mã cần thiết và lặp lại để tối ưu – đồng thời duy trì yêu cầu và ngữ cảnh kiến trúc trong suốt quy trình.
  • Vận hành doanh nghiệp và tác vụ văn phòng: quản lý dự án từ đầu đến cuối nhờ khả năng ghi nhớ lâu dài. Mô hình có thể tự động hóa quy trình, tạo bảng tính, slide và tài liệu chính xác.
  • Phân tích tài chính: xử lý các nguồn thông tin phức tạp như báo cáo pháp lý, dữ liệu thị trường, dữ liệu nội bộ để phục vụ mô hình dự đoán và tuân thủ chủ động. Độ chính xác cao giúp mô hình này phù hợp với người dùng thuộc lĩnh vực tài chính.
  • An ninh mạng: cung cấp khả năng phân tích chuyên nghiệp, tương quan log, cơ sở dữ liệu lỗ hổng và thông tin tình báo để hỗ trợ phát hiện sự cố và tự động phản ứng.

Claude Opus 4.5 tích hợp với Amazon Bedrock AgentCore

Amazon Bedrock đóng vai trò là nền tảng doanh nghiệp để triển khai Claude Opus 4.5 trong môi trường sản xuất. Đây là dịch vụ được quản lý hoàn toàn, cung cấp API thống nhất cho các mô hình nền tảng  với đầy đủ các tiêu chuẩn về bảo mật, tuân thủ và quản trị ở cấp độ doanh nghiệp.

Opus 4.5 được tích hợp trực tiếp với Amazon Bedrock AgentCore, giúp xây dựng và vận hành các AI agents một cách chuyên nghiệp. AgentCore cung cấp các năng lực hạ tầng chuyên dụng như bộ nhớ liên tục để duy trì ngữ cảnh giữa các phiên làm việc, Tool Gateway để chuyển API hoặc hàm AWS Lambda thành công cụ tương thích cho agents, cùng với cơ chế IAM tích hợp bảo vệ tài nguyên khi agents truy cập hệ thống.

Nhờ đó, doanh nghiệp có thể triển khai và giám sát agents với khả năng cô lập phiên làm việc, hỗ trợ quy trình kéo dài lên đến 8 giờ, và khả năng quan sát toàn diện, giúp nhóm phát triển tập trung vào xây dựng agents thay vì phải lo về hạ tầng.

Bên cạnh đó, AgentCore còn mở rộng khả năng triển khai thực tế bằng việc sử dụng Tool Gateway để chuyển đổi các API hiện có thành công cụ dùng cho tác tử mà chỉ cần viết rất ít mã. Tính năng này kết hợp với tool search của Opus 4.5 cho phép agents tự động tìm kiếm và chọn đúng công cụ cần thiết trong hàng trăm công cụ có sẵn.

Hệ thống quan sát tích hợp với Amazon CloudWatch giúp theo dõi các chỉ số quan trọng như mức sử dụng token, độ trễ và tỷ lệ lỗi trong toàn bộ quy trình agents, mang đến khả năng vận hành minh bạch và tối ưu hiệu suất.

Các tính năng quan trọng dành cho phát triển AI agents

Claude Opus 4.5 sở hữu nhiều khả năng để trở thành lựa chọn phù hợp để xây dựng AI agents triển khai trong môi trường sản xuất. Mô hình có thể duy trì mạch lập luận xuyên suốt trong các quy trình kéo dài, đảm bảo đưa ra quyết định nhất quán cho các tác vụ nhiều bước có thể diễn ra trong nhiều giờ hoặc nhiều ngày.

Khả năng xử lý công cụ được cải thiện giúp agents tương tác ổn định hơn với các hệ thống bên ngoài, API và giao diện phần mềm – mô hình tự chọn đúng công cụ cần dùng và diễn giải kết quả một cách chính xác hơn. Ngoài ra, Opus 4.5 còn có thể ghi nhớ thông tin qua nhiều lượt hội thoại và duy trì ngữ cảnh, cho phép tác tử tích lũy kiến thức theo thời gian và đưa ra quyết định dựa trên lịch sử tương tác.

Tham số effort (đang ở giai đoạn beta) cho phép người dùng chủ động kiểm soát lượng token sử dụng. Người dùng có thể đặt mức high để đạt chất lượng tốt nhất trong các tác vụ yêu cầu độ chính xác cao, medium để cân bằng chi phí và hiệu suất, hoặc low nếu cần tối ưu tiết kiệm token. Claude Opus 4.5 sẽ tự động điều chỉnh mức sử dụng token trong suy luận, gọi công cụ và phản hồi dựa trên thiết lập này.

Trong môi trường sản xuất, Amazon Bedrock AgentCore cung cấp khả năng giám sát và quan sát theo thời gian thực thông qua CloudWatch, giúp theo dõi mức tiêu thụ token (đặc biệt hữu ích khi cần điều chỉnh tham số effort), cùng với độ trễ, thời lượng phiên làm việc và tỷ lệ lỗi. Những dữ liệu này hỗ trợ tối ưu hiệu suất tác tử và quản lý chi phí hiệu quả.

Chi phí của Claude Opus 4.5

Claude Opus 4.5 được định giá 5 USD cho mỗi triệu token đầu vào và 25 USD cho mỗi triệu token đầu ra, giúp doanh nghiệp tiếp cận năng lực trí tuệ ở cấp độ Opus với chi phí chỉ bằng 1/3 so với các phiên bản trước.

Khả dụng và phương thức truy cập

Mô hình hiện đã có mặt trên Amazon Bedrock, hỗ trợ cross-Region inference, cho phép tự động định tuyến yêu cầu đến khu vực AWS còn dung lượng, từ đó đảm bảo thông lượng cao hơn, đặc biệt trong thời điểm nhu cầu tăng đột biến.

Claude Opus 4.5 đặc biệt phù hợp cho các agents cần xử lý nhiệm vụ kéo dài, phối hợp nhiều công cụ hoặc duy trì ngữ cảnh xuyên suốt phiên làm việc dài.

Để xem chi tiết về phạm vi khả dụng, giá, và thông số mô hình, bạn có thể truy cập tài liệu Amazon Bedrock.

Kết luận

Như vậy, người dùng đã có cái nhìn tổng quan về cách sử dụng Claude Opus 4.5 thông qua Amazon Bedrock. Đây là mô hình nổi bật trong các quy trình phức tạp và kéo dài như phát triển phần mềm và vận hành doanh nghiệp. Nhờ khả năng xử lý công cụ, quản lý ngữ cảnh và ra quyết định ổn định, Opus 4.5 trở thành một giải pháp mạnh mẽ để xây dựng tác tử AI hoạt động tin cậy trong môi trường sản xuất.

Mô hình đặc biệt hiệu quả với các tác tử trong lĩnh vực kỹ thuật phần mềm, tổng hợp nghiên cứu và tự động hóa quy trình doanh nghiệp.

Người dùng có thể thử áp dụng Opus 4.5 cho quy trình agents của riêng mình, cân nhắc cách mô hình có thể cải thiện các tác vụ thủ công hoặc mở ra các cơ hội tự động hóa mới trong tổ chức. Sự kết hợp giữa năng lực của Opus 4.5 và nền tảng doanh nghiệp của Amazon Bedrock mang đến một nền móng vững chắc để triển khai tác tử AI trong môi trường sản xuất.

Để bắt đầu, hãy truy cập vào Amazon Bedrock Console để trải nghiệm mô hình, xem tài liệu kỹ thuật chi tiết và tham khảo trang mô hình của Anthropic. 

Nếu bạn muốn triển khai tác tử ở quy mô lớn, hãy khám phá Opus 4.5 thông qua Amazon Bedrock AgentCore, nơi cung cấp hạ tầng được quản lý, khả năng điều phối công cụ và hệ thống giám sát chuyên nghiệp.

Theo dõi blog của OSAM để cập nhật các thông tin mới nhất về công nghệ!