Phó Chủ tịch cấp cao của Arm, Chris Bergey, chỉ ra rằng suy diễn AI sẽ là cốt lõi trong chiến lược tương lai của Arm. Sự mở rộng nhanh chóng của suy diễn ở cả thiết bị đầu cuối và trung tâm dữ liệu sẽ thúc đẩy việc áp dụng rộng rãi các IP kiến trúc Arm. Khi trọng tâm tính toán AI chuyển từ đào tạo sang suy diễn, Bergey cho biết, vị trí và giá trị của từng loại chip như CPU, GPU và NPU đang được tái cấu trúc.
Phạm vi ứng dụng của GPU đang mở rộng từ đồ họa sang suy diễn AI, tăng tốc các cảnh có mật độ tính toán cao như nâng cấp hình ảnh. Trong khi đó, CPU vẫn là nền tảng triển khai chính của các nhà phát triển nhờ tính phổ biến và tính linh hoạt. Mặc dù NPU có ưu thế về hiệu suất tiêu thụ năng lượng, nhưng vẫn cần chứng minh giá trị tích hợp của nó trong hệ thống.
Bergey chỉ ra rằng, trong quá khứ, thị trường chủ yếu tập trung vào đào tạo AI, nhưng suy diễn mới là chìa khóa để hiện thực hóa thương mại hóa AI, đặc biệt là ở phía thiết bị biên với tính năng thời gian thực và hiệu quả năng lượng. Trong những năm gần đây, Arm không chỉ giữ vị trí thống trị trong các thiết bị di động và IoT mà còn mở rộng thành công sang trung tâm dữ liệu, bao gồm cả AWS, Google và các nhà cung cấp điện toán đám mây khác đã đầu tư vào phát triển và triển khai chip kiến trúc Arm.
Về xu hướng thiết kế chip, ông cho biết từ năm 2021, NVIDIA đã chỉ ra rằng kiến trúc x86 truyền thống khó có thể đáp ứng nhu cầu I/O và băng thông cho tính toán AI. Arm, với lợi thế linh hoạt về kiến trúc, đã trở thành lựa chọn có thể mở rộng trong thời đại AI. Bergey nhấn mạnh: “Nền tảng Arm không chỉ nhất quán ở thiết bị đầu cuối mà còn trở thành nền tảng chung cho phát triển phần mềm trung tâm dữ liệu.”
Về mặt hỗ trợ phần mềm, Bergey đã chia sẻ tiến trình của thư viện tăng tốc AI Kleidi, hiện đã được tích hợp vào Microsoft ONNX Runtime, Meta’s ExecuTorch, Google LiteRT và mô hình hỗn hợp của Tencent. Theo ước tính, Kleidi đã đạt 8 tỷ lượt cài đặt trong vòng một năm, cho thấy sự chấp nhận của hệ sinh thái đang mở rộng nhanh chóng.
Bergey cũng đề cập rằng hệ thống điều hành tính toán đầu cuối (CSS), sẽ được phát hành vào năm 2024, đang từng bước tiến vào thị trường. Hiện đã có nhiều sản phẩm tích hợp chip Cortex-X925 ra mắt, bao gồm Mediatek Dimensity 9400 và NVIDIA DGX Spark. Ông dự đoán rằng vào cuối năm 2025, sẽ ra mắt sản phẩm CPU thế hệ mới với cải thiện IPC hai chữ số và tiếp tục củng cố phát triển GPU di động.
Khi nói về sự thay đổi của thị trường PC, ông chỉ ra rằng, trong thời kỳ hậu đại dịch, những kỳ vọng của người dùng về thời gian sử dụng pin, hiệu suất tản nhiệt và trải nghiệm đa phương tiện đã thúc đẩy ngành công nghiệp chuyển đổi sang kiến trúc Arm nhẹ hơn và hiệu quả hơn. Bergey cũng lạc quan về tỷ lệ thâm nhập của Chromebook trong tương lai trên nền tảng Arm.
Đối mặt với sự tiến hóa nhanh chóng của thị trường AI, ông tin rằng, giá trị lớn nhất của Arm là cung cấp một nền tảng đồng nhất và có thể mở rộng, cho phép các nhà phát triển phát triển từ thiết bị đeo tay đến các nền tảng tính toán quy mô lớn. Ông nhấn mạnh: “Vai trò của Arm không phải là dẫn đầu thiết bị đầu cuối, mà là trao quyền cho toàn bộ hệ sinh thái.”
(Bài viết này được ủy quyền bởi MoneyDJ News; hình ảnh đầu tiên nguồn: shutterstock)
Đọc thêm:
Trung tâm dữ liệu chuyển hướng, Arm nỗ lực chiếm lĩnh thị trường chip.