Thursday, November 21, 2024

[AWS] Machine Learning

-

Amazon Rekognition

Amazon Rekognition là một dịch vụ của AWS sử dụng trí tuệ nhân tạo để tìm kiếm các đối tượng, người, văn bản và cảnh trong hình ảnh và video. Nó cung cấp khả năng phân tích khuôn mặt và tìm kiếm khuôn mặt để thực hiện xác thực người dùng, đếm số lượng người, tạo cơ sở dữ liệu khuôn mặt quen thuộc hoặc so sánh với những người nổi tiếng. Amazon Rekognition có nhiều ứng dụng khác nhau, bao gồm nhận dạng nhãn, kiểm duyệt nội dung, phát hiện văn bản, phân tích khuôn mặt và tìm kiếm, nhận dạng nhân vật nổi tiếng và phân tích hành vi trong video (ví dụ: phân tích các đường đua thể thao).

Amazon Rekognition – Content Moderation

Amazon Rekognition – Content Moderation là một tính năng của dịch vụ Amazon Rekognition giúp phát hiện các nội dung không thích hợp, không mong muốn hoặc phản cảm trong hình ảnh và video. Tính năng này thường được sử dụng trong các trường hợp xã hội, truyền thông phát sóng, quảng cáo và thương mại điện tử để tạo ra trải nghiệm người dùng an toàn hơn.

Người dùng có thể thiết lập ngưỡng độ tin cậy tối thiểu cho các mục sẽ được đánh dấu và đưa ra xử lý tiếp theo. Các nội dung nhạy cảm có thể được đánh dấu để được xem lại bằng tay trong Amazon Augmented AI (A2I). Tính năng này giúp cho việc tuân thủ các quy định và quyền riêng tư liên quan đến nội dung trên mạng.

Amazon Transcribe

Amazon Transcribe là dịch vụ của AWS cho phép tự động chuyển đổi lời nói thành văn bản. Dịch vụ sử dụng quy trình học sâu gọi là nhận dạng giọng nói tự động (ASR) để chuyển đổi lời nói thành văn bản một cách nhanh chóng và chính xác. Nó cũng hỗ trợ Tự động Nhận dạng Ngôn ngữ cho âm thanh đa ngôn ngữ. Amazon Transcribe có thể được sử dụng để chuyển đổi các cuộc gọi dịch vụ khách hàng thành văn bản, tạo phụ đề và chú thích tự động, tạo siêu dữ liệu cho tài sản truyền thông để tạo một kho lưu trữ có thể tìm kiếm hoàn chỉnh. Ngoài ra, dịch vụ cũng tự động loại bỏ thông tin cá nhân (PII) bằng cách sử dụng chức năng redaction.

Amazon Polly

Amazon Polly là dịch vụ của Amazon Web Services cho phép chuyển đổi văn bản thành giọng nói tự nhiên bằng cách sử dụng học sâu. Điều này cho phép các lập trình viên tạo ra các ứng dụng có thể nói và tương tác với người dùng một cách tự nhiên hơn. Ví dụ, Polly có thể được sử dụng để tạo ra các bản tin, truyền thông hoặc ứng dụng hỗ trợ đọc sách với giọng đọc tự nhiên. Polly cũng cung cấp nhiều loại giọng đọc khác nhau, đảm bảo rằng ứng dụng có thể tùy chỉnh để phù hợp với nhu cầu của người dùng.

Amazon Polly – Lexicon & SSML

Polly là dịch vụ của Amazon cho phép chuyển đổi văn bản thành giọng nói tự nhiên bằng sử dụng deep learning. Tuy nhiên, trong một số trường hợp, cần phải tùy chỉnh việc phát âm của một số từ hoặc chữ cái đặc biệt, và để làm được điều này, ta có thể sử dụng Pronunciation lexicons. Pronunciation lexicons cho phép tùy chỉnh cách phát âm các từ như tên riêng, từ viết tắt, các từ đặc biệt khác. Sau khi tạo lexicons, chúng có thể được tải lên và sử dụng để chuyển đổi văn bản thành giọng nói trong các tình huống cần tùy chỉnh. Ngoài ra, Polly còn hỗ trợ tạo giọng nói từ văn bản thô hoặc từ tài liệu đánh dấu bằng Speech Synthesis Markup Language (SSML) để tùy chỉnh hơn nữa, ví dụ như nhấn mạnh từ hay cụm từ cần thiết, sử dụng phát âm từng âm tiết, bao gồm cả âm thanh thở và nói thì thầm, và sử dụng phong cách nói mới như phong cách nói của một phóng viên tin tức.

Amazon Translate

Amazon Translate là một dịch vụ của AWS cho phép dịch các nội dung văn bản và văn phạm từ một ngôn ngữ sang một ngôn ngữ khác một cách tự nhiên và chính xác, giúp cho các công ty và tổ chức có thể dịch các trang web, ứng dụng và các nội dung khác để phục vụ cho người sử dụng quốc tế một cách dễ dàng và hiệu quả. Dịch vụ này có khả năng dịch một lượng lớn văn bản và được tích hợp với các dịch vụ khác của AWS để đáp ứng nhu cầu dịch thuật trong các ứng dụng và quá trình phát triển sản phẩm.

Amazon Lex & Connect

Amazon Lex và Amazon Connect là hai dịch vụ của AWS được sử dụng cho các giải pháp liên quan đến trò chuyện và trung tâm dịch vụ khách hàng.

Amazon Lex sử dụng công nghệ nhận dạng giọng nói tự động để chuyển đổi giọng nói thành văn bản và phân tích ngôn ngữ tự nhiên để nhận diện ý định của khách hàng. Dịch vụ này giúp xây dựng các trò chuyện tự động, bot trung tâm cuộc gọi và các giải pháp liên quan đến trò chuyện.

Amazon Connect là một dịch vụ trung tâm dịch vụ khách hàng được cung cấp trên đám mây, cho phép nhận cuộc gọi, tạo luồng liên hệ và xây dựng trung tâm dịch vụ khách hàng ảo trên nền tảng AWS. Dịch vụ này cũng có thể tích hợp với các hệ thống quản lý mối quan hệ khách hàng khác và có chi phí thấp hơn đáng kể so với các giải pháp trung tâm dịch vụ khách hàng truyền thống.

Amazon Comprehend

Amazon Comprehend là một dịch vụ quản lý và không cần máy chủ cho xử lý ngôn ngữ tự nhiên (NLP). Dịch vụ này sử dụng học máy để tìm kiếm những thông tin quan trọng và mối quan hệ trong văn bản. Nó có thể xác định ngôn ngữ của văn bản, trích xuất các cụm từ chính, địa điểm, người, thương hiệu hoặc sự kiện, hiểu được tính tích cực hoặc tiêu cực của văn bản và phân tích văn bản bằng cách sử dụng phân tích từ và cú pháp. Ngoài ra, Comprehend còn tự động tổ chức một bộ sưu tập các file văn bản theo chủ đề. Một số ví dụ về việc sử dụng Comprehend là phân tích tương tác của khách hàng (email) để tìm ra những gì dẫn đến trải nghiệm tích cực hoặc tiêu cực, tạo và nhóm các bài viết theo chủ đề mà Comprehend sẽ khám phá.

Amazon Comprehend Medical

Amazon Comprehend Medical là một dịch vụ được quản lý hoàn toàn và không cần máy chủ. Nó sử dụng Trí tuệ nhân tạo để phát hiện và trả về thông tin hữu ích trong văn bản lâm sàng không cấu trúc, chẳng hạn như ghi chú của bác sĩ, bản tóm tắt xuất viện, kết quả xét nghiệm hay ghi chú về trường hợp bệnh. Nó sử dụng xử lý ngôn ngữ tự nhiên (NLP) để phát hiện thông tin cá nhân được bảo vệ trong thông tin lâm sàng (PHI) thông qua API DetectPHI. Bạn có thể lưu trữ tài liệu của mình trong Amazon S3, phân tích dữ liệu thời gian thực với Kinesis Data Firehose hoặc sử dụng Amazon Transcribe để chuyển đổi các câu chuyện của bệnh nhân thành văn bản có thể được phân tích bởi Amazon Comprehend Medical.

Amazon SageMaker

Amazon SageMaker là một dịch vụ quản lý hoàn toàn cho các nhà phát triển / khoa học dữ liệu để xây dựng các mô hình máy học. Thông thường, quá trình này rất khó để thực hiện tất cả các quy trình tại một nơi và cần phải cung cấp máy chủ. SageMaker giúp đơn giản hóa quá trình xây dựng mô hình máy học bằng cách cung cấp các công cụ và tài nguyên như một môi trường tích hợp.

Ví dụ, quá trình học máy có thể được sử dụng để dự đoán điểm thi của bạn. SageMaker có thể giúp bạn xây dựng mô hình học máy từ tập dữ liệu điểm thi của nhiều sinh viên, đưa ra dự đoán về điểm số dựa trên thông tin liên quan và đánh giá độ chính xác của mô hình.

Amazon Forecast

Amazon Forecast là dịch vụ quản lý hoàn toàn được sử dụng để dự báo với độ chính xác cao sử dụng Machine Learning (ML). Dịch vụ này giúp dự báo các sự kiện tương lai với độ chính xác cao, ví dụ như dự báo doanh số bán của một loại áo mưa, đồng thời giảm thời gian dự báo từ vài tháng xuống còn vài giờ. Nó có thể được sử dụng trong nhiều lĩnh vực như Lập kế hoạch yêu cầu sản phẩm, lập kế hoạch tài chính, lập kế hoạch tài nguyên và nhiều lĩnh vực khác.

Amazon Kendra

Amazon Kendra là một dịch vụ tìm kiếm tài liệu được quản lý hoàn toàn bằng máy học. Nó cho phép trích xuất câu trả lời từ bên trong một tài liệu (văn bản, PDF, HTML, PowerPoint, MS Word, câu hỏi thường gặp…) và có khả năng tìm kiếm bằng ngôn ngữ tự nhiên. Nó cũng có khả năng học hỏi từ tương tác/phản hồi của người dùng để cải thiện kết quả tìm kiếm và có thể được điều chỉnh thủ công để tăng cường tính chính xác của kết quả tìm kiếm.

Amazon Personalize

Amazon Personalize là dịch vụ quản lý hoàn toàn cho việc xây dựng ứng dụng với các gợi ý được cá nhân hóa, thời gian thực. Ví dụ, gợi ý sản phẩm cá nhân hóa hoặc tùy chỉnh marketing trực tiếp. Amazon Personalize sử dụng công nghệ tương tự như Amazon.com để cung cấp những gợi ý chính xác cho khách hàng. Nó tích hợp vào các trang web hiện có, ứng dụng, hệ thống SMS, hệ thống email marketing,… Sử dụng Amazon Personalize, bạn có thể triển khai chỉ trong vài ngày thay vì phải xây dựng, huấn luyện và triển khai các giải pháp máy học. Các trường hợp sử dụng của Amazon Personalize bao gồm các cửa hàng bán lẻ, truyền thông và giải trí…

Amazon Textract

Amazon Textract là một dịch vụ quản lý và hoàn toàn tự động, sử dụng trí tuệ nhân tạo và học máy để trích xuất văn bản, chữ viết tay và dữ liệu từ bất kỳ tài liệu quét nào. Nó có khả năng trích xuất dữ liệu từ các biểu mẫu và bảng. Bạn có thể đọc và xử lý bất kỳ loại tài liệu nào như PDF, hình ảnh và nhiều hơn nữa. Các trường hợp sử dụng của Textract bao gồm: tài chính (như hóa đơn, báo cáo tài chính), chăm sóc sức khỏe (như hồ sơ y tế, đơn yêu cầu bồi thường bảo hiểm) và các văn bản của ngành công chúng (như các biểu mẫu thuế, giấy tờ tùy thân, hộ chiếu).

AWS Machine Learning – Summary

  • Rekognition: dịch vụ nhận diện khuôn mặt, gắn nhãn và nhận diện nổi tiếng
  • Transcribe: chuyển đổi âm thanh thành văn bản (ví dụ: tạo phụ đề)
  • Polly: chuyển đổi văn bản thành âm thanh
  • Translate: dịch thuật
  • Lex: xây dựng chatbot trò chuyện
  • Connect: trung tâm liên lạc đám mây
  • Comprehend: xử lý ngôn ngữ tự nhiên
  • SageMaker: máy học cho các nhà phát triển và nhà khoa học dữ liệu
  • Forecast: xây dựng dự báo chính xác cao
  • Kendra: công cụ tìm kiếm được trang bị máy học
  • Personalize: gợi ý cá nhân hóa thời gian thực.
Previous article
Next article

LEAVE A REPLY

Please enter your comment!
Please enter your name here

4,956FansLike
256FollowersFollow
223SubscribersSubscribe
spot_img

Related Stories