AMD Instinct MI350 ra mắt, trong khi series MI400 và máy chủ AI Helios dạng giá sẽ xuất hiện vào năm 2026.

Tại hội nghị Advancing AI 2025, Chủ tịch và Giám đốc điều hành AMD, Lisa Su, cho biết sự phát triển trí tuệ nhân tạo của AMD chưa bao giờ dừng lại. Công ty luôn nỗ lực thiết lập tiêu chuẩn mới cho ngành, cung cấp giải pháp thực sự có thể triển khai và có khả năng mở rộng.

Dòng sản phẩm AMD Instinct MI350, mang lại sức mạnh cho khối lượng công việc AI hiện đại

Để đáp ứng nhu cầu cơ sở hạ tầng AI hiện đại, AMD đã giới thiệu dòng GPU AMD Instinct MI350, bao gồm các mô hình MI350X và MI355X. Những GPU này dựa trên kiến trúc AMD CDNA 4, nhằm hỗ trợ các nhà đổi mới trong mọi lĩnh vực, giúp họ phát triển nhanh hơn, mở rộng thông minh hơn và xây dựng tương lai.

Dòng sản phẩm MI350 nâng cao sức mạnh tính toán AI gấp bốn lần, với khả năng suy diễn tăng vọt 35 lần, mở đường cho các giải pháp AI cách mạng trong mọi ngành công nghiệp. Dòng MI350 cung cấp dung lượng bộ nhớ HBM3E 288GB hàng đầu trong ngành, cùng băng thông bộ nhớ lên tới 8TB/s, đảm bảo cả suy diễn và đào tạo đều có thể đạt được lưu lượng vượt trội.

Về tính linh hoạt trong triển khai, dòng MI350 hỗ trợ cấu hình làm mát bằng gió và làm mát bằng nước trực tiếp, tối ưu hóa việc triển khai liền mạch. Khung làm mát bằng gió hỗ trợ tối đa 64 GPU, trong khi khung làm mát bằng nước trực tiếp hỗ trợ lên tới 128 GPU, cung cấp hiệu suất lên tới 2.6 exaFLOPS cho FP4/FP6. Điều này giúp thúc đẩy triển khai AI dựa trên hạ tầng tiêu chuẩn ngành và giảm chi phí.

Ngoài ra, hệ sinh thái của dòng MI350 đang phát triển mạnh mẽ và luôn sẵn sàng triển khai. Nó sẽ được cung cấp rộng rãi thông qua các nhà cung cấp dịch vụ đám mây hàng đầu, bao gồm các nền tảng điện toán quy mô lớn chính và Neo Cloud thế hệ tiếp theo, cung cấp cho khách hàng các tùy chọn mở rộng AI đám mây linh hoạt. Đồng thời, các nhà sản xuất OEM hàng đầu như Dell, HPE và Supermicro đang tích cực tích hợp giải pháp MI350 vào nền tảng của họ, nhằm cung cấp hạ tầng AI mạnh mẽ tại chỗ và lai.

ROCm 7 là động cơ phần mềm mở nhanh chóng cho việc tăng cường AI

Lisa Su nhấn mạnh, trí tuệ nhân tạo đang phát triển với tốc độ kỷ lục, trong khi tầm nhìn của AMD về ROCm là mở khóa đổi mới cho mọi người thông qua một nền tảng mở, có khả năng mở rộng và tập trung vào nhà phát triển. Trong năm qua, ROCm đã nhanh chóng trưởng thành, cung cấp hiệu suất suy diễn hàng đầu, mở rộng khả năng đào tạo và sâu sắc hóa sự tích hợp với cộng đồng mã nguồn mở.

Hiện tại, ROCm đã hỗ trợ một số nền tảng AI lớn nhất toàn cầu, từ những ngày đầu đã hỗ trợ các mô hình phổ biến như LLaMA và DeepSeek. Trong phiên bản ROCm 7 sắp ra mắt, hiệu suất suy diễn sẽ được cải thiện hơn 3.5 lần. Với các bản cập nhật thường xuyên, các loại dữ liệu tiên tiến như FP4 và các thuật toán mới như FAv3, ROCm đang cung cấp năng lượng cho thế hệ AI tiếp theo. Đồng thời, nó cũng đang thúc đẩy các khung mã nguồn mở như vLLM và SGLang phát triển nhanh hơn so với các giải pháp đóng.

Khi ứng dụng AI chuyển từ nghiên cứu sang triển khai doanh nghiệp thực tế, ROCm cũng đang ngày càng phát triển. AI doanh nghiệp ROCm đưa nền tảng MLOps đến tiên tiến với các công cụ chìa khóa trao tay dùng cho việc tinh chỉnh, compliance, triển khai và tích hợp, đạt được AI an toàn và có khả năng mở rộng. Hiện đã có hơn 1.8 triệu mô hình từ Hugging Face sẵn sàng sử dụng, cho thấy ROCm không chỉ bắt kịp mà còn dẫn đầu cuộc cách mạng AI mở.

Các nhà phát triển luôn là trung tâm mọi hoạt động của AMD. AMD cam kết cung cấp trải nghiệm xuất sắc thông qua các công cụ mở hộp mạnh mẽ hơn, bảng điều khiển CI tức thì, dữ liệu phong phú và cộng đồng nhà phát triển năng động, giúp việc xây dựng với ROCm trở nên dễ dàng chưa từng có. Để tăng tốc đổi mới, AMD rất vui mừng giới thiệu AMD Developer Cloud, cho phép các nhà phát triển dễ dàng truy cập ROCm và GPU AMD ngay lập tức. Dù là tối ưu hóa mô hình ngôn ngữ lớn hay mở rộng nền tảng suy diễn, ROCm 7 cung cấp các công cụ mà các nhà phát triển cần, giúp họ nhanh chóng chuyển từ giai đoạn thử nghiệm sang sản xuất.

Dự đoán về dòng sản phẩm AMD Instinct MI400 và máy chủ AI “Helios”

Lisa Su nhấn mạnh rằng cam kết đổi mới của AMD không chỉ dành cho dòng sản phẩm Instinct MI350, công ty đã tiết lộ thế hệ tiếp theo của dòng sản phẩm AMD Instinct MI400, dự kiến sẽ ra mắt vào năm 2026, đại diện cho một cấp độ hiệu suất hoàn toàn mới. Dòng MI400 sẽ đại diện cho một bước nhảy vọt đáng kể về hiệu suất, cung cấp giải pháp toàn bộ khung cho đào tạo quy mô lớn và suy diễn phân tán. Các đổi mới hiệu suất chính của dòng sản phẩm MI400 bao gồm bộ nhớ HBM4 lên tới 432GB, băng thông dung lượng bộ nhớ lên tới 19.6TB/s. Hiệu suất FP4 đạt 40 PF và hiệu suất FP8 đạt 20 PF, băng thông mở rộng ngang tối đa lên tới 300GB/s.

Cũng sẽ ra mắt vào năm 2026 là kiến trúc máy chủ AI “Helios”, có thiết kế hoàn toàn mới nhằm tích hợp các chip hàng đầu của AMD, CPU AMD EPYC Venice, GPU Instinct MI400 và Pensando Vulcano AI NI, cũng như phần mềm ROCm vào một giải pháp hoàn toàn tích hợp. Helios sẽ cung cấp một hệ thống thống nhất, hỗ trợ các miền mở rộng dọc chặt chẽ, tối đa 72 GPU dòng MI400, với băng thông mở rộng dọc lên tới 260TB/s và hỗ trợ Ultra Accelerator Link.

(Hình ảnh đầu tiên lấy từ báo cáo công nghệ mới)