Card đồ hoạ cao cấp Nvidia RTX A3000
GPU NVIDIA RTX A3000 hay A3000 Mobile là card đồ họa chuyên nghiệp dành cho máy trạm di động. Nó dựa trên chip GA104 Ampere và cung cấp hiệu năng tương tự như GPU GeForce RTX 3060 trên laptop. Tuy nhiên, nó cung cấp thêm 256 lõi CUDA (4.096 so với 3.840) và dựa trên chip GA104 lớn hơn. A3000 cũng hỗ trợ PCIe 4.0 và tích hợp 32 lõi RT và 128 lõi Tensor thuộc thế hệ Ampere. Nó có sẵn ở các biến thể khác nhau từ 60 - 130 Watt (TGP) với tốc độ xung nhịp (và hiệu năng) khác nhau. GPU hỗ trợ eDP 1.4b để kết nối màn hình bên trong và DisplayPort 1.4 và HDMI 2.1 cho các kết nối bên ngoài.
Vào năm 2022, Nvidia đã phát hành phiên bản cải tiến một chút của RTX A3000 với VRAM nhiều hơn và nhanh hơn. 6 GB ban đầu với 11 Gbits đã được tăng gấp đôi lên 12 GB GDDR6 tốc độ 14 Gbits.
RTX A3000 không còn biến thể Max-Q (trước đây được sử dụng cho các biến thể công suất thấp) nhưng mọi OEM đều có thể chọn triển khai các công nghệ Max-Q (Dynamic Boost, WhisperMode).
Đặc trưng Quadro RTX A3000
Chip GA104 cung cấp 6.144 ALU FP32, trong đó một nửa cũng có thể thực thi các lệnh INT32 (tức là 3.072 ALU INT32). Với Turing, tất cả các shaders vẫn có thể thực thi các lệnh FP32 hoặc INT32. Theo Nvidia, các lõi raytracing và tensor trên chip cũng được cải tiến. A3000 chỉ sử dụng 4.096 trong số 6.144 nhân CUDA. Các chip Ampere cũng bao gồm bộ mã hóa video thế hệ thứ 5 cải tiến (NVENC cho H.264 và H.265) và bộ giải mã thế hệ thứ 7 (dành cho nhiều định dạng khác nhau, bao gồm cả AV1).
Chip GA104 do Samsung sản xuất trên tiến trình 8nm (8N), nó không hoàn toàn có thể theo kịp tiến trình 7nm tại TSMC (ví dụ: được AMD sử dụng và cả chip GA100 Ampere chuyên nghiệp).
Hiệu năng Quadro RTX A3000
Hiệu năng thuần sẽ tương tự như GeForce RTX 3060 dành cho laptop ở cùng mức TGP. Cả hai GPU đều phụ thuộc nhiều vào khả năng làm mát tốt và TGP cao để có hiệu năng tốt. Ở mức tiêu thụ điện năng tương tự, RTX A3000 nhanh hơn đáng kể so với Quadro RTX 3000 và 3000 Max-Q cũ.
Thông số kỹ thuật Quadro RTX A3000
Codename | GA104 |
Architecture | Ampere |
Pipelines | 4096 - unified |
TMUs | 128 |
ROPs | 64 |
Raytracing Cores | 32 |
Tensor / AI Cores | 128 |
Core Speed | 1080 - 1560 (Boost) MHz |
Memory Speed | 14000 effective = 1750 MHz |
Memory Bus Width | 192 Bit |
Memory Type | GDDR6 |
Max. Amount of Memory | 12 GB |
Shared Memory | no |
Memory Bandwidth | 264 GB/s |
API | DirectX 12_2, Shader 6.7, OpenGL 4.6 |
Power Consumption | 130 Watt (60 - 115 Watt TGP) |
Transistor Count | 17.4 Billion |
Die Size | 392 mm² |
technology | 8 nm |
PCIe | 4.0 |
Displays | HDMI 2.1, DisplayPort 1.4 |
Features | DisplayPort 1.4, HDMI 2.1, PCIe 4.0 x16, 12.8 SP-FP TFLOPS Peak, 102 Tensor Performance Peak, up to 264 GB/s Memory Bandwidth, Resizable BAR, Support for Modern Standby |
Viết bình luận