Tập tành tìm hiểu AWS EC2 Overview và thi exam
Định nghĩa
Amazon Elastic Compute Cloud (Amazon EC2) là một cơ sở hạ tầng điện toán đám mây được cung cấp bởi Amazon Web Services (AWS) giúp cung cấp tài nguyên máy tính ảo hoá theo yêu cầu.
Tổng quan
- Amazon EC2 cung cấp các ứng dụng máy tính ảo hoá có thể mở rộng về khả năng xử lý cùng các thành phần phần cứng ảo như bộ nhớ máy tính (RAM), vi xử lý, linh hoạt trong việc lựa chọn các phân vùng lưu trữ dữ liệu ở các nền tảng khác nhau và sự an toàn trong quản lý dịch vụ bởi kiến trúc ảo hoá đám mây mạnh mẽ của AWS.
- Amazon EC2 sẽ cung cấp một hoặc máy chủ ảo có thể kết hợp với nhau để dễ dàng triển khai ứng dụng nhanh nhất và đảm bảo tính sẵn sàng cao nhất. Thậm chí về mặt thanh toán bạn dễ dàng biết được các mức chi phí cần thanh toán dựa trên thông tin tài nguyên bạn sử dụng.
- Hỗ trợ các hệ điều hành: Amazon EC2 hỗ trợ nhiều hệ điều hành: Red Hat Enterprise, SUSE Enterprise và Oracle Enterprise Linux, UNIX, Windows Server, v.v... Các hệ điều hành này cần được triển khai kết hợp với Amazon Virtual Private Cloud (VPC)
Các đặc tính của Amazon EC2
1. Scaling:
- Scaling Up/Down: Tăng/Giảm capacity(RAM, CPU,...) của Instance.
- Scaling In/Out: Tăng/Giảm số lượng Instance.
2. Security:
- Có thể thiết lập rank IP Private dành riêng cho EC2.
- Sử dụng Security Group và Network ACLS để control inbound/outbound.
- Có thể thiết lập IPsec VPN giữa Data Center và AWS Clound.
- Delicated Instance -> Tạo EC2 trên 1 hardware physical dành riêng cho 1 khách hàng duy nhất.
3. Cost:
- On-Demand Instance: Tính theo giờ, đáp ứng nhu cầu dùng trong thời gian ngắn. Dùng bao nhiêu, trả bấy nhiêu.
- Reserved Instance: Cho phép trả trước 1 lượng Server cho 1 hoặc 3 năm. Chi phí chỉ bằng 75% so với On-Demand. Nêú không có nhu cầu sử dụng trong thời gian dài, bạn có thể sale tại Reserved Instance Marketplace
- Spot Instances: Cho phép bạn tận dụng mức công suất EC2 không sử dụng trong đám mây AWS. Phiên bản dùng ngay được giảm giá tới 90% so với giá của phiên bản Theo nhu cầu. Bạn có thể sử dụng Phiên bản Spot cho nhiều ứng dụng không có trạng trái, có dung sai cao hay linh hoạt, chẳng hạn như dữ liệu lớn, khối lượng công việc có trong bộ chứa, CI/CD, máy chủ web, điện toán hiệu năng cao (HPC) và các khối lượng công việc phát triển & kiểm thử
- Savings Plans: Là một mô hình định giá linh hoạt giúp bạn tiết kiệm tới 72% mức sử dụng điện toán AWS. Mô hình định giá này tính giá thấp hơn đối với mức sử dụng các phiên bản Amazon EC2 bất kể dòng phiên bản, kích cỡ, hệ điều hành, hình thức thuê hoặc Khu vực AWS và cũng áp dụng cho mức sử dụng AWS Fargate và AWS Lambda. Đồng thời phải cam kết sử dụng trong thời hạn 1 hoặc 3 năm.
Các tính năng nổi bật của Amazon EC2
- Đáng tin cậy: Amazon EC2 cung cấp một môi trường có độ tin cậy cao, thay thế nhanh các Instance. Cam kết chất lượng dịch vụ SLA (Service Level Agreement) có sẵn 99,9% cho mỗi khu vực Amazon EC2.
- Được thiết kế cho Amazon Web Services: Amazon EC2 hoạt động tốt với các dịch vụ của Amazon như Amazon S3, Amazon RDS, Amazon DynamoDB và SQS của Amazon. Nó cung cấp một giải pháp hoàn chỉnh cho máy tính, xử lý truy vấn và lưu trữ trên một loạt các ứng dụng.
- Bảo mật: Amazon EC2 hoạt động trong Amazon đám mây riêng ảo (Virtual Private Cloud) để cung cấp một mạng lưới an toàn và mạnh mẽ cho các tài nguyên.
- Công cụ linh hoạt: Amazon EC2 cung cấp các công cụ cho các nhà phát triển và quản trị viên hệ thống để xây dựng các ứng dụng và cô lập nó khỏi các tình huống thất bại chung.
- Không tốn kém:Bạn chỉ phải trả tiền cho những tài nguyên bạn sử dụng. Nó có nhiều gói mua như On-Demand Instances, Reserved Instances, Spot Instances, v.v…để bạn lựa chọn theo nhu cầu
Bảng tổng quan
1. Loại phiên bản đa dụng (General purpose)
Phiên bản mục đích chung cung cấp các tài nguyên mạng, bộ nhớ và điện toán cân bằng, có thể dùng cho nhiều tải công việc đa dạng. Đây là dòng phiên bản lý tưởng cho những ứng dụng sử dụng đồng đều các tài nguyên này
Các loại EC2 phiên bản đa dụng: Mac, T2, T3, T3a, T4g, M5, M5a, M5n, M5zn, M6g, M4, A1
a) Phần cứng chip xử lý
- Các phiên bản M5, M5d và T3 có bộ xử lý dòng Intel Xeon Platinum 8000 3,1 GHz từ thế hệ đầu tiên (Skylake-SP) hoặc thế hệ thứ hai (Cascade Lake).
- Các phiên bản M5a, M5ad và T3a có bộ xử lý AMD EPYC 7000 series 2,5 GHz.
- Các phiên bản M5zn được trang bị CPU Intel thế hệ thứ hai (Cascade Lake) cung cấp tần số turbo toàn lõi lên đến 4,5 GHz và băng thông mạng lên đến 100 Gbps.
- Các phiên bản T4g, M6g và M6gd có bộ xử lý AWS Graviton2 dựa trên kiến trúc Arm 64-bit.
- Các phiên bản Mac có bộ xử lý Intel Core i7 thế hệ thứ tám (Coffee Lake) 3,2 GHz.
b) Hiệu suất phiên bản
Các phiên bản được tối ưu hóa EBS cho phép các phiên bản EC2 sử dụng đầy đủ IOPS được cung cấp trên một ổ đĩa EBS. Các phiên bản được tối ưu hóa EBS cung cấp thông lượng chuyên dụng giữa Amazon EC2 và Amazon EBS, với các tùy chọn từ 500 đến 4.000 Megabit mỗi giây (Mbps) tùy thuộc vào loại phiên bản được sử dụng
c) Tính đáp ứng của các loại phiên bản
Loại phiên bản EC2 |
Đặc tính nổi bật |
Phù hợp với các yêu cầu |
M5 và M5a |
Cung cấp một cơ sở hạ tầng đám mây lý tưởng, cung cấp sự cân bằng về tài nguyên máy tính, bộ nhớ và mạng cho một loạt các ứng dụng được triển khai trên đám mây |
- Cơ sở dữ liệu vừa và nhỏ - Các tác vụ xử lý dữ liệu yêu cầu bộ nhớ bổ sung - Máy chủ phụ trợ cho SAP, Microsoft SharePoint, điện toán theo cụm |
M5zn |
Phiên bản này lý tưởng cho các ứng dụng yêu cầu hiệu suất luồng làm việc cực cao, thông lượng cao và mạng có độ trễ thấp |
- Chơi Game - Máy chủ cần hiệu suất cao - Máy chủ mô phỏng các loại mô hình |
M6g |
Phiên bản này được cung cấp bộ xử lý AWS Graviton2 và cung cấp khả năng tính toán, bộ nhớ và mạng cân bằng cho một phạm vi rộng, một khối lượng công việc lớn |
- Máy chủ ứng dụng - Máy chủ nền tảng Game - Kho dữ liệu cỡ vừa - Xây dựng các dịch vụ với quy mô nhỏ |
Mac |
Phiên bản cung cấp băng thông mạng lên đến 10 Gbps và băng thông EBS 8 Gbps thông qua kết nối Thunderbolt 3 tốc độ cao |
Phù hợp để phát triển, xây dựng, kiểm tra và ký ứng dụng cho các thiết bị Apple, chẳng hạn như iPhone, iPad, iPod, Mac, Apple Watch và Apple TV |
T2, T3, T3a, T4 |
Các phiên bản này cung cấp mức hiệu suất cơ bản của CPU với khả năng bùng nổ lên mức cao hơn khi khối lượng công việc của bạn yêu cầu cao. Phiên bản Unlimited có thể duy trì hiệu suất CPU cao trong bất kỳ khoảng thời gian nào bất cứ khi nào được yêu cầu |
- Xây dựng trang Web hoặc ứng dụng Web - Lưu trữ dữ liệu dạng mã Code - Xây dựng môi trường: Development, build, Test và Environments - Xây dựng các dịch vụ với quy mô nhỏ |
2. Loại phiên bản tối ưu khả năng tính toán (Compute Optimized)
Phiên bản Tối ưu hóa khả năng điện toán rất lý tưởng cho các ứng dụng liên quan đến điện toán cần có bộ xử lý hiệu suất cao để hoạt động hiệu quả. Các phiên bản thuộc dòng này rất phù hợp với những khối lượng công việc xử lý hàng loạt, chuyển mã nội dung truyền thông, máy chủ web hiệu năng cao, điện toán hiệu năng cao (HPC), lập mô hình khoa học, máy chủ game chuyên dụng và công cụ máy chủ quảng cáo, ứng dụng suy diễn máy học và các ứng dụng điện toán chuyên sâu khác
Các loại EC2 phiên bản tối ưu khả năng tính toán: C4, C5, C5a, C5n, C6g, C6gn
a) Phần cứng chip xử lý
- Phiên bản C4 có bộ xử lý Intel Xeon E5-2666 v3 (Haswell) có tốc độ xung nhịp cao được tối ưu hóa dành riêng cho EC2.
- Các phiên bản C5 và C5n có bộ xử lý dòng Intel Xeon Platinum 8000 3,1 GHz từ thế hệ đầu tiên (Skylake-SP) hoặc thế hệ thứ hai (Cascade Lake).
- Phiên bản C5a có bộ xử lý AMD EPYC thế hệ thứ hai (Rome) chạy ở tần số cao tới 3,3. GHz.
- Các phiên bản C6g, C6gd và C6gn có bộ xử lý AWS Graviton2 dựa trên kiến trúc Arm 64-bit.
b) Hiệu suất phiên bản
Các phiên bản này được tối ưu hóa EBS cho phép các phiên bản EC2 sử dụng đầy đủ IOPS được cung cấp trên một ổ đĩa EBS. Các phiên bản được tối ưu hóa EBS cung cấp thông lượng chuyên dụng giữa Amazon EC2 và Amazon EBS, với các tùy chọn từ 500 đến 4.000 Megabit mỗi giây (Mbps) tùy thuộc vào loại phiên bản được sử dụng
c) Tính đáp ứng của các phiên bản
Loại phiên bản EC2 |
Đặc tính nổi bật |
Phù hợp với các yêu cầu |
C5, C5a, C5n |
|
- Khối lượng công việc xử lý hàng loạt - Chuyển mã phương tiện - Máy chủ web hiệu suất cao - Máy chủ hiệu suất cao (HPC) - Xây dựng các mô hình khoa học - Máy chủ trò chơi chuyên dụng và công cụ phân phát quảng cáo - Các ứng dụng máy tính chuyên sâu |
C6g, C6gn |
Các phiên bản này được cung cấp bởi bộ xử lý AWS Graviton2 và lý tưởng để chạy các khối lượng công việc nâng cao, chuyên sâu về máy tính |
- Máy chủ hiệu suất cao (HPC) - Xử lý hàng loạt công việc - Ứng dụng chạy dịch vụ quảng cáo - Xử lý Video - Máy chủ trò chơi - Các ứng dụng phân tích khoa học
|
3. Phiên bản tối ưu hóa bộ nhớ (Memory Optimized)
Các phiên bản Tối ưu hóa bộ nhớ được thiết kế để cung cấp hiệu suất nhanh cho các tải công việc cần xử lý các bộ dữ liệu lớn trong bộ nhớ
Các loại EC2 phiên bản tối ưu hóa bộ nhớ: R4, R5, R5a, R5b, R5n, R6g, X1e, X1, Z1d, High Memory(u-6tb1, u-9tb1, u-12tb1, u18tb1, u24tb1)
a) Phần cứng chip xử lý
- Các phiên bản R4 có tối đa 64 vCPU và được hỗ trợ bởi hai bộ xử lý Intel XEON được AWS tùy chỉnh dựa trên E5-2686v4 có băng thông bộ nhớ cao và bộ nhớ đệm L3 lớn hơn để tăng hiệu suất của các ứng dụng trong bộ nhớ.
- Các phiên bản R5, R5b và R5d có bộ xử lý dòng Intel Xeon Platinum 8000 3,1 GHz từ thế hệ đầu tiên (Skylake-SP) hoặc thế hệ thứ hai (Cascade Lake).
- Các phiên bản R5a và R5ad có bộ xử lý AMD EPYC 7000 series 2,5 GHz.
- Các phiên bản R6g và R6gd có bộ xử lý AWS Graviton2 dựa trên kiến trúc Arm 64-bit.
- Các phiên bản bộ nhớ cao (u-6tb1.metal, u-9tb1.metal và u-12tb1.metal) là những phiên bản đầu tiên được cung cấp bởi nền tảng tám socket với bộ vi xử lý Intel Xeon Platinum 8176M (Skylake) thế hệ mới nhất. được tối ưu hóa cho khối lượng công việc quan trọng của doanh nghiệp. Các phiên bản Bộ nhớ cao với 18 TB và 24 TB bộ nhớ (u-18tb1.metal và u-24tb1.metal) là những phiên bản đầu tiên được hỗ trợ bởi nền tảng 8-socket với bộ vi xử lý Intel Xeon Scalable 8280L (Cascade Lake) thế hệ thứ 2.
- Phiên bản X1e và X1 có tối đa 128 vCPU và được cung cấp bởi bốn bộ xử lý Intel Xeon E7-8880 v3 có băng thông bộ nhớ cao và bộ nhớ đệm L3 lớn hơn để tăng hiệu suất của các ứng dụng trong bộ nhớ.
b) Hiệu suất phiên bản
Các phiên bản được tối ưu hóa cho bộ nhớ cho phép tăng hiệu suất mật mã thông qua tính năng Intel AES-NI mới nhất, hỗ trợ Tiện ích mở rộng đồng bộ hóa giao dịch Intel (TSX) để tăng hiệu suất xử lý dữ liệu giao dịch trong bộ nhớ và hỗ trợ hướng dẫn bộ xử lý Phần mở rộng vectơ nâng cao 2 (Intel AVX2) để mở rộng hầu hết các lệnh số nguyên đến 256 bit.
c) Tính đáp ứng của các phiên bản
Loại phiên bản EC2 |
Đặc tính nổi bật |
Phù hợp với các yêu cầu |
R5, R5a, R5b, R5n |
|
- Cơ sở dữ liệu hiệu suất cao, quan hệ (MySQL) và NoSQL (MongoDB, Cassandra). - Các kho lưu trữ bộ đệm ẩn quy mô web phân tán cung cấp bộ nhớ đệm trong bộ nhớ của dữ liệu loại khóa-giá trị (Memcached và Redis). - Cơ sở dữ liệu trong bộ nhớ sử dụng các định dạng và phân tích lưu trữ dữ liệu được tối ưu hóa cho thông tin kinh doanh (ví dụ: SAP HANA). - Các ứng dụng thực hiện xử lý thời gian thực đối với dữ liệu lớn không có cấu trúc (dịch vụ tài chính, cụm Hadoop / Spark). - Các ứng dụng điện toán hiệu suất cao (HPC) và Tự động hóa thiết kế điện tử (EDA) |
R6g |
Các phiên bản này được cung cấp bởi bộ xử lý AWS Graviton2 và lý tưởng để chạy khối lượng công việc đòi hỏi nhiều bộ nhớ |
- Cơ sở dữ liệu mã nguồn mở (ví dụ: MySQL, MariaDB và PostgreSQL) - Bộ nhớ đệm trong bộ nhớ (ví dụ: Memcached, Redis và KeyDB) |
X1 |
|
- Cơ sở dữ liệu trong bộ nhớ như SAP HANA, bao gồm hỗ trợ được SAP chứng nhận cho Business Suite S / 4HANA, Business Suite trên HANA (SoH), Business Warehouse trên HANA (BW) và Data Mart Solutions trên HANA - Các công cụ xử lý dữ liệu lớn như Apache Spark hoặc Presto. - Các ứng dụng điện toán hiệu suất cao (HPC). |
X1e |
|
- Cơ sở dữ liệu hiệu suất cao. - Cơ sở dữ liệu trong bộ nhớ như SAP HANA. - Các ứng dụng doanh nghiệp sử dụng nhiều bộ nhớ. |
Z1d |
Phiên bản này cung cấp khả năng tính toán cao và bộ nhớ cao |
- Tự động hóa thiết kế điện tử (EDA) - Khối lượng công việc cơ sở dữ liệu lớn |
High Memory |
|
- Chạy cơ sở dữ liệu lớn trong bộ nhớ bao gồm cơ sở dữ liệu trong bộ nhớ SAP HANA |
4. Phiên bản tối ưu hóa ổ lưu trữ (Storage Optimized)
Các phiên bản tối ưu hóa ổ lưu trữ được thiết kế cho khối lượng công việc yêu cầu quyền truy cập cao, đọc và ghi tuần tự vào các tập dữ liệu rất lớn trên bộ nhớ cục bộ. Chúng được tối ưu hóa để cung cấp hàng chục nghìn thao tác vào / ra ngẫu nhiên, có độ trễ thấp mỗi giây (IOPS) cho các ứng dụng.
Các loại EC2 phiên bản tối ưu hóa ổ lưu trữ: I3, I3en, D2, D3, D3en, H1
a) Phần cứng đặc trưng
- Các phiên bản được được trang bị chip xử lý thuộc loại chip Intel Xeon hoặc AMD EPYC.
- Các phiên bản D2, D3, D3en được lưu trữ chính trên các ổ thuộc loại ổ HDD, các phiên bản I3, I3en được lưu trữ trên loại bộ nhớ SSD (NVMe) là loại ổ lưu trữ cung cấp tốc độ đọc/ghi và truy xuất dữ liệu cực nhanh đồng thời dữ liệu sẽ không bị xóa khi máy tính khởi động lại.
b) Tính đáp ứng của các phiên bản
Loại phiên bản EC2 |
Phù hợp với các yêu cầu |
D2 |
- Kho dữ liệu xử lý khổng lồ - Lưu trữ lịch sử truy xuất ứng dụng |
D3, D3en |
- Các khối lượng công việc lớn về lưu trữ như GPFC, BeeFS… - Máy chủ hiệu suất cao để chạy sử dụng lưu trữ dữ liệu lớn |
H1 |
- Các ứng dụng yêu cầu quyền truy cập tốc độ cao và số lượng lớn dữ liệu - Khối lượng công việc sử dụng nhiều dữ liệu như MapReduce… |
I3, I3en |
- Hệ thống xử lý giao dịch trực tuyến tần số cao - Cơ sở dữ liệu quan hệ - Cơ sở dữ liệu NoSQL - Bộ nhớ đệm cho cơ sở dữ liệu Redis - Ứng dụng kho dữ liệu |
5. Phiên bản tối ưu điện toán tăng tốc (Accelerated Computing)
Phiên bản điện toán tăng tốc sử dụng các bộ tăng tốc phần cứng hay còn gọi là bộ đồng xử lý để thực hiện một số chức năng (như tính toán số dấu phẩy động, xử lý đồ họa hoặc so khớp mẫu dữ liệu) hiệu quả hơn so với phần mềm chạy trên nhiều CPU.
Các loại EC2 phiên bản tối ưu điện toán tăng tốc: P2, P3, P4, Inf1, G4dn, G4ad, G3, F1
Thông tin các loại phiên bản
Loại phiên bản EC2 |
Đặc tính nổi bật |
Phù hợp với các yêu cầu |
P2 |
Sử dụng GPU NVIDIA Tesla K80 và được thiết kế cho mục đích tính toán GPU bằng cách sử dụng các mô hình lập trình CUDA hoặc OpenCL. Các phiên bản P2 cung cấp mạng băng thông cao, khả năng dấu phẩy động chính xác đơn và kép mạnh mẽ và bộ nhớ 12 GiB cho mỗi GPU |
- Xây dụng CSDL dạng đồ thị - Ứng dụng có CSDL hiệu suất cao - Tài chính kế toán - Phân tích khoa học, sinh học (mã Gen) |
P3 |
Các phiên bản này sử dụng GPU NVIDIA Tesla V100 và được thiết kế cho mục đích chung tính toán GPU bằng cách sử dụng các mô hình lập trình CUDA hoặc OpenCL hoặc thông qua một khuôn khổ học máy. Các phiên bản P3 cung cấp mạng băng thông cao, khả năng dấu phẩy động chính xác một nửa, đơn và kép mạnh mẽ và bộ nhớ lên đến 32 GiB cho mỗi GPU |
- Machine/Deep learning - động lực học chất lưu sử dụng máy điện toán - tài chính sử dụng máy điện toán - nhận dạng giọng nói - Xe tự lái - Tìm kiếm các loại thuốc |
P4 |
Phiên bản này sử dụng GPU NVIDIA A100 và cung cấp nền tảng hiệu suất cao cho khối lượng công việc của máy học và HPC. Các phiên bản P4d cung cấp thông lượng và hỗ trợ băng thông mạng tổng hợp 400 Gbps, Bộ điều hợp vải đàn hồi (EFA) |
- Công nghệ máy học - Điện toán hiệu suất cao - Nhận dạng giọng nói - Xe tự hành và tìm kiếm hoạt chất tiềm năng |
G3 |
Sử dụng GPU NVIDIA Tesla M60 và cung cấp nền tảng hiệu suất cao, hiệu quả về chi phí cho các ứng dụng đồ họa sử dụng DirectX hoặc OpenGL. Phiên bản G3 cũng cung cấp các tính năng Máy trạm ảo NVIDIA GRID, chẳng hạn như hỗ trợ bốn màn hình có độ phân giải lên đến 4096x2160 và Ứng dụng ảo NVIDIA GRID |
- Hình ảnh 3D - Máy trạm từ xa có yêu cầu cao về đồ họa, kết xuất hình ảnh 3D - Phát trực tuyến ứng dụng, mã hóa Video |
G4dn |
Sử dụng GPU NVIDIA Tesla và cung cấp nền tảng hiệu suất cao, tiết kiệm chi phí cho mục đích chung tính toán GPU bằng cách sử dụng CUDA hoặc khuôn khổ học máy cùng với các ứng dụng đồ họa sử dụng DirectX hoặc OpenGL. Các phiên bản này cung cấp mạng băng thông cao, khả năng dấu phẩy động chính xác một nửa và chính xác mạnh mẽ, cùng với các phân vùng INT8 và INT4. Mỗi GPU có 16 GiB bộ nhớ GDDR6 |
- Nhận diện vật thể, thêm siêu dữ liệu vào hình ảnh - Nhận dạng giọng nói tự động và dịch ngôn ngữ - Các ứng dụng yêu cầu cao về đồ họa - Thiết kế ảnh và phát trò chơi trực tuyến |
G4ad |
Sử dụng GPU AMD Radeon Pro V520 và bộ xử lý AMD EPYC thế hệ thứ 2, cấp tối đa 4 GPU AMD Radeon Pro V520, 64 vCPU, mạng 25 Gbps và bộ lưu trữ SSD dựa trên NVMe cục bộ 2,4 TB |
- Các ứng dụng có yêu cầu cao về đồ họa - Thiết kế ảnh hiện thực - Phát trò chơi trực tuyến trên Cloud |
F1 |
Sử dụng Xilinx UltraScale + VU9P FPGA, Mỗi FPGA trong phiên bản F1 chứa khoảng 2,5 triệu phần tử logic và khoảng 6.800 công cụ xử lý tín hiệu kỹ thuật số (DSP), cùng với 64 GiB bộ nhớ DDR ECC cục bộ được bảo vệ, được kết nối với phiên bản bằng kết nối PCIe Gen3 x16 chuyên dụng. Các phiên bản F1 cung cấp ổ SSD NVMe cục bộ |
- Nghiên cứu cấu trúc Gen - Xử lý video thời gian thực - Tìm kiếm và phân tích dữ liệu lớn và bảo mật
|
Inf1 |
Sử dụng chip suy luận máy học AWS Inferentia. Inferentia được phát triển để cho phép hiệu suất suy luận độ trễ thấp hiệu quả về chi phí cao ở bất kỳ quy mô nào |
- Công cụ đề xuất, dự báo, phân tích hình ảnh và video - Phân tích văn bản nâng cao - Chép lời và phát hiện gian lận |
Quy tắc đặt tên các loại EC2
- Instance family: Loại EC2 tối ưu
- Instance generation: Thế hệ của loại EC2 tương ứng
- Attribute: Thuộc tính loại EC2
- Instance size: Kích cỡ của loại EC2
Bảng diễn giải Instance family
Bảng diễn giải Attribute
Quy cách tính size instance (xlarge)