ROCm là gì và vì sao quan trọng?
ROCm (Radeon Open Compute) là bộ trình điều khiển, thư viện và công cụ tăng tốc AI tương tự như NVIDIA CUDA. Suốt nhiều năm, AMD chỉ ưu tiên ROCm cho các GPU trung tâm dữ liệu Instinct; người dùng máy tính cá nhân gần như bị bỏ quên. Kết quả: laptop Ryzen AI hay desktop Ryzen Threadripper mạnh mẽ nhưng khó tận dụng toàn lực cho AI vì thiếu “đầu não” phần mềm.
ROCm 7 – cú chuyển mình mang Windows trở lại cuộc chơi
Tại sự kiện Advancing AI ngày 12/6, AMD công bố ROCm 7 với hai bước ngoặt:
-
Tối ưu hiệu năng inferencing: tăng tốc 3,2–3,8 lần cho các mô hình lớn như Llama 3 70B, Qwen2-72B, DeepSeek R1 so với ROCm 6.
-
Hỗ trợ Windows: từ quý III/2025, PyTorch bản preview sẽ chạy ROCm trên Windows; ONNX-EP cập nhật ngay tháng 7. Đây là đòn phản công trực diện vào “thành trì” CUDA, mở đường để mọi GPU Radeon, APU Ryzen AI, Ryzen AI Max hay Threadripper đều tham gia hệ sinh thái AI PC.
Lộ trình mở rộng: từ máy trạm tới PC cá nhân
AMD cam kết đưa ROCm 7 “in-box” vào các bản phân phối Linux lớn (Red Hat, Ubuntu, SUSE) cuối 2025. Trong khi đó, biểu đồ kích cỡ mô hình gợi ý:
-
Ryzen AI 300 notebook: chạy trơn LLM 7–13 tỷ tham số.
-
Ryzen AI Max desktop: đủ sức gánh 70B tham số.
-
Threadripper + Radeon GPU: thậm chí xử lý trên 100B tham số ở tốc độ cao.
Hiệu năng sánh vai – thậm chí vượt NVIDIA
Nhờ ROCm 7, GPU Instinct MI355X đạt hiệu suất inferencing DeepSeek R1 cao hơn 1,3 lần so với NVIDIA Blackwell B200 (cùng độ chính xác FP8). AMD cũng ghi nhận tốc độ huấn luyện tăng gấp ba so với ROCm thế hệ trước.
Còn thiếu mảnh ghép “sân chơi AI” cho người dùng cuối
Intel có AI Playground, NVIDIA gắn tên với LM Studio, giúp tải sẵn mô hình đã “đo ni đóng giày”. AMD hiện yêu cầu người dùng tự vào Hugging Face tìm phiên bản đã quantize cho Ryzen/Radeon. Đại diện công ty thừa nhận đây là “ý tưởng hay” và gợi mở khả năng ra mắt công cụ tương tự trong tương lai.
Ý nghĩa với cộng đồng PC
Việc ROCm chính thức “cập bến” Windows đánh dấu bước ngoặt: người dùng laptop Ryzen AI hoặc desktop Radeon không còn lép vế trong làn sóng ứng dụng AI nội bộ (local). Từ tạo văn bản, hình ảnh, tới lập trình, tất cả sẽ tận dụng triệt để phần cứng AMD thay vì chỉ Intel-NVIDIA.