Trong bài đăng này, chúng tôi thảo luận về cách sử dụng điện toán đám mây AWS và các dịch vụ của nó để đẩy nhanh các nghiên cứu quan sát (Observational study) cho khách hàng khoa học đời sống. Chúng tôi cung cấp một kiến trúc tham khảo cho các kiến trúc sư, chủ doanh nghiệp và những người ra quyết định về công nghệ trong ngành khoa học đời sống để tự động hóa các quy trình trong nghiên cứu lâm sàng.
Nghiên cứu quan sát (Observational study) dẫn đầu trong nghiên cứu, cho phép bạn hình thành các giả thuyết và kiểm tra các giả thuyết đó trong các thí nghiệm có kiểm soát. Những nghiên cứu này là một công cụ mạnh mẽ để giúp các nhà nghiên cứu tìm hiểu những gì xảy ra trong các nghiên cứu thực tế. Bạn có thể sử dụng nghiên cứu này như một tiền đề cho việc khám phá thuốc và các chỉ định thuốc mới. Học hỏi được từ các nghiên cứu quan sát trong lĩnh vực phát triển thuốc có thể loại bỏ sớm những thất bại tiềm ẩn và tiết kiệm hàng triệu đô la. Để thực hiện một nghiên cứu quan sát, trước tiên một cơ quan độc lập phải xác định và phê duyệt nó. Những người tham gia phải được xác định và tuyển dụng. Nhân viên xử lý và thu thập dữ liệu phải được đào tạo. Dữ liệu của người tham gia phải được thu thập. Sau khi dữ liệu đã được nắm bắt, nó phải được đánh giá bởi các nhân viên chuyên nghiệp. Cuối cùng, kết quả được trình bày.
Do sự phát triển của công nghệ, việc nghiên cứu thuốc hiện đang sử dụng các công nghệ tiên tiến cho genomics, proteomics và các công việc đòi hỏi nhiều tính toán khác với chi phí giảm đáng kể. Các nhà cung cấp dịch vụ nghiên cứu lâm sàng đang sử dụng công nghệ và tự động hóa để hỗ trợ thu thập dữ liệu thử nghiệm lâm sàng, nhưng việc sử dụng các dịch vụ này có thể tốn kém chi phí cho các nghiên cứu quan sát. Các công ty thực hiện các nghiên cứu quan sát để nghiên cứu có xu hướng quay trở lại với các cơ chế thủ công để thu thập và xử lý dữ liệu. Hãy tưởng tượng thách thức của việc nắm bắt và quản lý dữ liệu cho các nghiên cứu có thể có hàng trăm, nếu không phải hàng nghìn người tham gia đang hoàn thành các cuộc khảo sát trên giấy. Các dịch vụ AWS có thể tự động hóa và cải thiện việc thu thập dữ liệu và báo cáo phân tích cho cả người tham gia và các nhà nghiên cứu. Điều này giảm thiểu chi phí, thời gian và sai sót, và nó có thể mở rộng quy mô khi cần thiết với nỗ lực tối thiểu.
Với sự phát triển của công nghệ Internet of Things (IoT), AWS đã giúp người tham gia và các công ty dễ dàng hơn trong việc cung cấp dữ liệu nghiên cứu có giá trị từ các nghiên cứu quan sát. Từ góc độ bệnh nhân, họ có thể cung cấp phản hồi bằng cách sử dụng Alexa, máy tính xách tay, thiết bị di động hoặc thậm chí là iWatch và không bao giờ rời khỏi sự thoải mái trong nhà của họ. Đối với công ty, lỗi dữ liệu có thể được giảm thiểu và tốc độ thu thập dữ liệu là tức thời.
Công nghệ IoT cũng cung cấp lượng dữ liệu khổng lồ mà bạn có thể sử dụng cho các thông tin chi tiết về AI hoặc máy học (ML) trong tương lai. Đây là một lợi ích bổ sung cho các công ty đang tìm kiếm giá trị trong dữ liệu phi cấu trúc.
Dịch vụ AWS có thể trợ giúp như thế nào?
Ở cấp độ cao, kiến trúc này bao gồm các dịch vụ sau:
Amazon Alexa
Amazon CloudWatch
Amazon Comprehend Medical
Amazon DynamoDB
Amazon EMR
AWS Identity and Access Management (IAM)
Amazon Kendra
AWS Key Management Service (AWS KMS)
Amazon Macie
Amazon QuickSight
Amazon Redshift
Amazon SageMaker Studio
Amazon Simple Storage Service (Amazon S3)
Amazon đã giới thiệu và mở rộng chương trình kỹ năng Alexa đủ điều kiện HIPAA, giúp các nhà phát triển và doanh nghiệp dễ dàng và an toàn hơn trong việc chấp thuận các kỹ năng của họ về quyền riêng tư, tuân thủ và các yêu cầu pháp lý. Bảo mật là ưu tiên hàng đầu nhưng có thể dễ dàng quản lý bằng các phương pháp hay nhất của AWS. Ví dụ: tất cả dữ liệu được lưu trữ trong Amazon S3 có thể được mã hóa theo mặc định hoặc có thể được khách hàng quản lý bằng các khóa từ AWS KMS.
Bạn có thể sử dụng Amazon Macie để quét dữ liệu trong Amazon S3. Nếu có bất kỳ dữ liệu nhạy cảm nào, bao gồm thông tin nhận dạng cá nhân (PII), bạn có thể sử dụng tự động hóa để đảm bảo rằng các nhóm và đối tượng đó được bảo mật hoặc cảnh báo những người có trách nhiệm thực hiện các hành động thích hợp.
Phương pháp hay nhất do AWS đề xuất là cung cấp các vai trò dịch vụ cho các dịch vụ AWS để tương tác với các dịch vụ hoặc người dùng khác với sự cho phép tối thiểu cần thiết để thực hiện các hành động dự định. Bạn có thể sử dụng IAM để tạo vai trò và các thực thể người dùng với các chính sách truy cập chi tiết.
Sau đây là bảng phân tích chi tiết về quy trình làm việc được đề xuất:
– Tất cả dữ liệu thu được từ các cuộc hội thoại Alexa được tự động đẩy vào một nhóm S3 bảo mật ở định dạng JSON.
– Tất cả dữ liệu IoT được truyền trực tuyến vào một nhóm S3 bảo mật thông qua các dịch vụ AWS IoT Core hoặc Amazon Kinesis.
– Các tệp được thả vào nhóm S3 sẽ kích hoạt các chức năng AWS Lambda để thực hiện các tác vụ sau:
Chuyển dữ liệu qua Amazon Comprehend để thực hiện phân tích tình cảm và lưu trữ thông tin này trong DynamoDB cho các mục đích báo cáo trong tương lai. Tự động hóa có thể được xây dựng theo cách mà nếu điểm số cảm xúc tiêu cực khi sử dụng API thông minh của Amazon lớn hơn, ví dụ: 0,8, cảnh báo qua email có thể được gửi tới người quản lý nghiên cứu để theo dõi. Bạn có thể sử dụng Amazon Comprehend để xác định và biên tập lại PII và Amazon Comprehend Medical có các API để phát hiện thông tin PHI trong bảng điểm Alexa.
Lưu trữ thông tin nghiên cứu cụ thể trong DynamoDB để giúp hỗ trợ các yêu cầu quản lý, giám sát nghiên cứu và báo cáo trong tương lai.
– Các công việc Amazon EMR biến đổi và làm phong phú dữ liệu cho các phân tích trong tương lai. Bạn có thể lên lịch để thực hiện các công việc này theo định kỳ hoặc chu kỳ.
– SageMaker Studio được sử dụng trên cả dữ liệu thô và dữ liệu đã biến đổi để đạt được giá trị ẩn từ lượng lớn dữ liệu có cấu trúc và không có cấu trúc. Các công cụ của SageMaker như AutoML có thể giúp bất kỳ tổ chức nào sử dụng các cơ hội AI / ML mà không cần có kiến thức sâu rộng về khoa học dữ liệu. Nếu tổ chức của bạn có một nhóm khoa học dữ liệu phức tạp, bạn có thể sử dụng Studio để xử lý dữ liệu; xây dựng, đào tạo và xác nhận các mô hình; và cuối cùng là triển khai các mô hình, tất cả trong một nền tảng MLOps duy nhất, dễ sử dụng.
– Amazon Kendra có thể được sử dụng để tìm kiếm câu trả lời trong dữ liệu văn bản phi cấu trúc.
– Amazon Redshift và QuickSight cung cấp trực quan hóa dữ liệu, báo cáo phân tích và phân phối báo cáo tự động. QuickSight Q, được cung cấp bởi ML, cho phép bạn đặt các câu hỏi bằng ngôn ngữ tự nhiên dựa trên dữ liệu của mình, giúp tiết kiệm hàng tuần công sức xây dựng các mô hình dữ liệu và bảng điều khiển được xác định trước.
Kết luận
Giải pháp này cho thấy các khả năng sử dụng các công nghệ AWS khác nhau để tự động hóa các nghiên cứu quan sát. Chúng tôi khuyên bạn nên thử giải pháp cho chính mình và sử dụng kiến trúc tham khảo được cung cấp. Vui lòng thực hiện thẩm định và thực hiện các sửa đổi cần thiết đối với kiến trúc; bạn cũng có thể triển khai một phần dựa trên nhu cầu của mình.
Để biết thêm thông tin liên quan đến việc triển khai kiến trúc được đề xuất, phương án triển khai phù hợp với doanh nghiệp mình vui lòng liên hệ Osam để được hỗ trợ miễn phí. Đọc thêm nhiều kiến thức, tin tức bổ ích về điện toán đám mây và công nghệ thông tin tại Blog của Osam nhé!
Tham khảo thêm: