DeepSeek R1 hiện có thể triển khai trên AWS - OSAM | Cloud Computing Services

DeepSeek R1 một AI mới ra trên thị trường đang làm mưa làm gió với độ xử lí cao và chi phí thấp với mô hình ngôn ngữ lớn có khả năng suy luận mạnh mẽ, tương đương với OpenAI, được phát triển với chi phí thấp hơn đáng kể và có giấy phép mở, cho phép sử dụng miễn phí. DeepSeek R1 có khả năng giải quyết những bài toán phức tạp như toán học và lập trình với độ chính xác cao nhờ ứng dụng các kỹ thuật tiên tiến trong huấn luyện và kiến trúc. Sự ra đời của DeepSeek R1 đánh dấu một bước tiến quan trọng trong việc phát triển các mô hình AI mạnh mẽ, rẻ tiền hơn và dễ tìm hiểu hơn cho cộng đồng.

Tìm hiểu thêm: https://osam.io/5-xu-huong-cong-nghe-du-bao-se-bung-no-trong-nam-2025/

https://osam.io/agentic-ai/

DeepSeek R1

DeepSeek-R1-Zero với 671 tỷ tham số và các mô hình DeepSeek-R1-Distill có phạm vi từ 1,5–70 tỷ tham số vào ngày 20 tháng 1 năm 2025. Họ đã thêm mô hình Janus-Pro-7B dựa trên tầm nhìn của mình vào ngày 27 tháng 1 năm 2025. Các mô hình này được công khai và được báo cáo là có giá cả phải chăng và tiết kiệm chi phí hơn 90-95% so với các mô hình tương đương. Theo Deepseek, mô hình của họ nổi bật với khả năng lập luận, đạt được thông qua các kỹ thuật đào tạo sáng tạo như học tăng cường.

Các doanh nghiệp có thể triển khai các mô hình DeepSeek-R1 trong Amazon Bedrock và Amazon SageMaker AI. Amazon Bedrock là lựa chọn tốt nhất cho các nhóm muốn tích hợp nhanh các mô hình nền tảng được đào tạo trước thông qua API. Amazon SageMaker AI là lựa chọn lý tưởng cho các tổ chức muốn tùy chỉnh, đào tạo và triển khai nâng cao, với quyền truy cập vào cơ sở hạ tầng cơ bản. Ngoài ra, bạn cũng có thể sử dụng AWS Trainium và AWS Inferentia để triển khai các mô hình DeepSeek-R1-Distill một cách tiết kiệm chi phí thông qua Amazon Elastic Compute Cloud (Amazon EC2) hoặc Amazon SageMaker AI.

Với AWS, bạn có thể sử dụng các mô hình DeepSeek-R1 để xây dựng, thử nghiệm và mở rộng quy mô các ý tưởng AI tạo sinh của mình một cách có trách nhiệm bằng cách sử dụng mô hình mạnh mẽ, tiết kiệm chi phí này với khoản đầu tư cơ sở hạ tầng tối thiểu. Bạn cũng có thể tự tin thúc đẩy sự đổi mới AI tạo sinh bằng cách xây dựng trên các dịch vụ AWS được thiết kế riêng cho bảo mật. Chúng tôi đặc biệt khuyên bạn nên tích hợp các triển khai mô hình DeepSeek-R1 của mình với Amazon Bedrock Guardrails để thêm một lớp bảo vệ cho các ứng dụng AI tạo sinh của mình, có thể được sử dụng bởi cả khách hàng AI của Amazon Bedrock và Amazon SageMaker.

Bạn có thể chọn cách triển khai các mô hình DeepSeek-R1 trên AWS ngay hôm nay theo một số cách sau:

1/ Amazon Bedrock Marketplace cho mô hình DeepSeek-R1,

2/ Amazon SageMaker JumpStart cho mô hình DeepSeek-R1,

3/ Amazon Bedrock Custom Model Import cho các mô hình DeepSeek-R1-Distill

4/ Amazon EC2 Trn1 instances cho các mô hình DeepSeek-R1-Distill.

Hãy để tôi hướng dẫn bạn qua các con đường khác nhau để bắt đầu với các mô hình DeepSeek-R1 trên AWS. Cho dù bạn đang xây dựng ứng dụng AI đầu tiên hay mở rộng quy mô các giải pháp hiện có, các phương pháp này cung cấp các điểm khởi đầu linh hoạt dựa trên chuyên môn và yêu cầu của nhóm bạn.

1. Mô hình DeepSeek R1 trong Amazon Bedrock Marketplace

Amazon Bedrock Marketplace cung cấp hơn 100 FM phổ biến, mới nổi và chuyên biệt cùng với lựa chọn hiện tại của các mô hình hàng đầu trong ngành trong Amazon Bedrock. Bạn có thể dễ dàng khám phá các mô hình trong một danh mục duy nhất, đăng ký mô hình và sau đó triển khai mô hình trên các điểm cuối được quản lý.

Để truy cập mô hình DeepSeek R1 trong Amazon Bedrock Marketplace, hãy vào bảng điều khiển Amazon Bedrock và chọn danh mục Mô hình trong phần Mô hình nền tảng. Bạn có thể nhanh chóng tìm thấy DeepSeek bằng cách tìm kiếm hoặc lọc theo nhà cung cấp mô hình.

Sau khi kiểm tra trang chi tiết mô hình bao gồm các khả năng của mô hình và hướng dẫn triển khai, bạn có thể triển khai trực tiếp mô hình bằng cách cung cấp tên điểm cuối, chọn số lượng phiên bản và chọn loại phiên bản.

Amazon Bedrock Guardrails cho phép người dùng tùy chỉnh các cài đặt bảo mật và hạ tầng cho mô hình DeepSeek R1, bao gồm mạng VPC, quyền vai trò dịch vụ và mã hóa. Tính năng này cho phép đánh giá độc lập các đầu vào của người dùng và đầu ra của mô hình, kiểm soát tương tác với DeepSeek R1 bằng các chính sách đã được xác định. Các rào chắn có thể được tích hợp với các công cụ Bedrock khác như Amazon Bedrock Agents và Knowledge Bases để xây dựng các ứng dụng AI sinh tạo an toàn và bảo mật hơn.

2. Mô hình DeepSeek-R1 trong Amazon SageMaker JumpStart

Amazon SageMaker JumpStart là trung tâm học máy (ML) với FM, thuật toán tích hợp và các giải pháp ML dựng sẵn mà bạn có thể triển khai chỉ bằng vài cú nhấp chuột. Để triển khai DeepSeek-R1 trong SageMaker JumpStart, bạn có thể khám phá mô hình DeepSeek-R1 trong SageMaker Unified Studio, SageMaker Studio, bảng điều khiển SageMaker AI hoặc theo chương trình thông qua SageMaker Python SDK.

Trong bảng điều khiển Amazon SageMaker AI, hãy mở SageMaker Studio và chọn JumpStart rồi tìm kiếm “DeepSeek-R1” trong trang Tất cả các mô hình công khai.

Bạn có thể chọn mô hình và chọn triển khai để tạo điểm cuối với các thiết lập mặc định. Khi điểm cuối đến InService, bạn có thể suy luận bằng cách gửi yêu cầu đến điểm cuối của nó.

Các tính năng AI của Amazon SageMaker như Pipelines, Debugger và container logs giúp suy ra hiệu suất mô hình và kiểm soát hoạt động ML. Mô hình được triển khai trong môi trường bảo mật AWS và dưới sự kiểm soát của VPC, hỗ trợ bảo mật dữ liệu. API ApplyGuardrail trong SageMaker JumpStart tách biệt các biện pháp bảo vệ khỏi mô hình DeepSeek-R1, tích hợp các biện pháp bảo vệ doanh nghiệp được chuẩn hóa vào luồng ứng dụng.

3. Các mô hình DeepSeek-R1-Distill sử dụng Amazon Bedrock Custom Model Import

Amazon Bedrock Custom Model Import cung cấp khả năng nhập và sử dụng các mô hình tùy chỉnh của bạn cùng với các FM hiện có thông qua một API thống nhất, không cần máy chủ duy nhất mà không cần quản lý cơ sở hạ tầng cơ bản. Với Amazon Bedrock Custom Model Import, bạn có thể nhập các mô hình DeepSeek-R1-Distill có phạm vi từ 1,5–70 tỷ tham số. Như tôi đã nêu trong bài đăng trên blog của mình về Amazon Bedrock Model Distillation, quy trình chưng cất bao gồm việc đào tạo các mô hình nhỏ hơn, hiệu quả hơn để mô phỏng các mẫu hành vi và lý luận của mô hình DeepSeek R1 lớn hơn với 671 tỷ tham số bằng cách sử dụng nó làm mô hình giáo viên.

Sau khi lưu trữ các mô hình có sẵn công khai này trong thùng Amazon Simple Storage Service (Amazon S3) hoặc Amazon SageMaker Model Registry, hãy chuyển đến các mô hình đã nhập trong các mô hình Foundation trong bảng điều khiển Amazon Bedrock và nhập và triển khai chúng trong môi trường được quản lý hoàn toàn và không cần máy chủ thông qua Amazon Bedrock. Phương pháp không cần máy chủ này loại bỏ nhu cầu quản lý cơ sở hạ tầng đồng thời cung cấp khả năng mở rộng và bảo mật cấp doanh nghiệp.

Cập nhật ngày 1 tháng 2 – Sau khi nhập mô hình đã được chưng cất, bạn có thể sử dụng sân chơi Bedrock để hiểu các phản hồi của mô hình đã được chưng cất cho các dữ liệu đầu vào của mình.

Xem video demo do đồng nghiệp của tôi thực hiệnXem video demo do đồng nghiệp của tôi Du’An Lightfoot thực hiện để nhập mô hình và suy luận vào sân chơi Bedrock.

Link video tại đây: https://youtu.be/1aq_ju70qHQ

4. Các mô hình DeepSeek R1-Distill sử dụng AWS Trainium và AWS Inferentia

AWS Deep Learning AMI (DLAMI) cung cấp các hình ảnh máy tùy chỉnh mà bạn có thể sử dụng để học sâu trong nhiều phiên bản Amazon EC2, từ phiên bản nhỏ chỉ có CPU đến phiên bản đa GPU mạnh mẽ mới nhất. Bạn có thể triển khai các mô hình DeepSeek-R1-Distill trên phiên bản AWS Trainuim1 hoặc AWS Inferentia2 để có được hiệu suất giá tốt nhất.

Để bắt đầu, hãy truy cập bảng điều khiển Amazon EC2 và khởi chạy phiên bản EC2 trn1.32xlarge với Neuron Multi Framework DLAMI có tên là Deep Learning AMI Neuron (Ubuntu 22.04).

Sau khi bạn đã kết nối với phiên bản ec2 đã khởi chạy, hãy cài đặt vLLM, một công cụ nguồn mở để phục vụ Mô hình ngôn ngữ lớn (LLM) và tải xuống mô hình DeepSeek R1-Distill từ Hugging Face. Bạn có thể triển khai mô hình bằng vLLM và gọi máy chủ mô hình.

Để tìm hiểu thêm, hãy tham khảo hướng dẫn từng bước này về cách triển khai các mô hình DeepSeek-R1-Distill Llama trên AWS Inferentia và Trainium.

Bạn cũng có thể truy cập các thẻ mô hình DeepSeek-R1-Distill trên Hugging Face, chẳng hạn như DeepSeek-R1-Distill-Llama-8B hoặc deepseek-ai/DeepSeek-R1-Distill-Llama-70B. Chọn Triển khai rồi chọn Amazon SageMaker. Từ tab AWS Inferentia và Trainium, hãy sao chép mã ví dụ để triển khai các mô hình DeepSeek-R1-Distill.

Kể từ khi phát hành DeepSeek R1, nhiều hướng dẫn triển khai cho Amazon EC2 và Amazon Elastic Kubernetes Service (Amazon EKS) đã được đăng tải. Sau đây là một số tài liệu bổ sung để bạn tham khảo:

5. OSAM hỗ trợ doanh nghiệp triển khai Deepseek R1 trên AWS như thế nào?

OSAM là đơn vị chuyên cung cấp giải pháp triển khai và tối ưu hệ thống AI trên AWS. Khi hợp tác với OSAM, doanh nghiệp sẽ nhận được:

Tư vấn kiến trúc hạ tầng: OSAM hỗ trợ thiết kế kiến trúc AWS phù hợp với Deepseek R1 để đảm bảo hiệu suất cao và tối ưu chi phí.
Triển khai và tối ưu mô hình: OSAM giúp doanh nghiệp triển khai Deepseek R1 trên AWS, tinh chỉnh hiệu suất, giảm thiểu độ trễ và tối ưu hóa tài nguyên.
Quản lý và bảo trì: Dịch vụ giám sát 24/7, tối ưu hệ thống, đảm bảo an toàn dữ liệu và xử lý sự cố nhanh chóng.
Đào tạo và hỗ trợ kỹ thuật: OSAM cung cấp hướng dẫn và đào tạo để doanh nghiệp có thể vận hành và khai thác Deepseek R1 hiệu quả trên AWS.

Kết luận

Triển khai Deepseek R1 trên AWS là một giải pháp tối ưu cho doanh nghiệp muốn khai thác sức mạnh AI mà không cần đầu tư hạ tầng vật lý. Với sự hỗ trợ từ OSAM, doanh nghiệp có thể yên tâm triển khai, vận hành và tối ưu hệ thống AI trên AWS một cách hiệu quả, bảo mật và tiết kiệm chi phí. Nếu bạn quan tâm đến giải pháp này, hãy liên hệ OSAM ngay hôm nay để được tư vấn chi tiết!