Chip AI Blackwell B200 có thể biến lời nói thành video 3D
Con chip AI mang mã hiệu Blackwell B200 mới này của NVIDIA chính là bom tấn tạo nên sự đột phá trong ngành công nghệ trí tuệ nhân tạo.
Trong vài năm gần đây, ngành công nghệ trí tuệ nhân tạo đang dần trở thành xu hướng và NVIDIA đang dẫn đầu xu hướng này với con chip AI H100 - xuất hiện hầu hết trên các siêu máy tính chuyên dụng ở các tập đoàn công ty lớn trên thế giới. Đây chính là vũ khí đã làm nên sự độc tôn của NVIDIA và biến tập đoàn này được định giá cao hơn cả Alphabet (công ty mẹ của Google) và Amazon. Nhưng mọi thứ không chỉ dừng lại ở đó khi NVIDIA tiếp tục giới thiệu chip AI mới nhất của mình với GPU Blackwell B200 và siêu chip AI Blackwell GB200.
Tại sự kiện GPU Technology Conference 2024, ông Jensen Huang - chủ tịch của NVIDIA đã công bố GPU B200 sẽ đem lại sức mạnh xử lý AI đạt 20 petaflop với 208 tỷ bóng bán dẫn. Khi 2 chip GB200 này kết hợp cùng một CPU Grace (siêu chip cho máy chủ) sẽ đem lại sức mạnh nhanh hơn tới 30 lần khi xử lý mô hình ngôn ngữ lớn (LLM) so với chip H100 đồng thời cũng giúp giảm chi phí và năng lượng tiêu thụ tới 25 lần. Điểm đặc biệt hơn đó là Blackwell B200 có khả năng tính toán cục bộ siêu nhanh giúp cho việc xử lý các tác vụ AI vốn trước đây gặp khó khăn xử lý chậm hoặc chưa thể làm được, như là chuyển lời nói thành video 3D.
Để có thể huấn luyện AI bằng 1,8 nghìn tỷ tham số mô hình, chip H100 sẽ mất tới 8000 đơn vị GPU và tốn tới 15 mega watt điện. Trong khi đó, ông Huang khẳng định việc này sẽ chỉ hết 2000 đơn vị GPU và chỉ tốn có 4 mega watt điện - một sự tiết kiệm đáng kể. Kết quả khi benchmark với GPT-3 LLM, B200 cho hiệu năng nhanh hơn ít nhất là 7 lần so với H100.
Yếu tố giúp cho Blackwell B200 tạo được sự bứt phá kinh ngạc về khả năng tính toán, băng thông so với thế hệ cũ đó chính là sử dụng 4 bit cho mỗi đơn vị neuron thay vì 8 bit như trước đây. Tiếp đó là kết nối NVLink mới giúp cho việc kết hợp tới 576 GPU với băng thông 2 chiều 1,8 terabyte mỗi giây. NVIDIA cũng đã thiết kế một mạch chip mới có 50 tỷ bóng bán dẫn với 3,6 teraflop FP8.
NVIDIA dự kiến sẽ đóng gói B200 thành một tổ hợp gồm nhiều chip với nhau gọi là siêu chip GB200 NVL72 để phục vụ nhu cầu của các công ty, tập đoàn lớn. Mỗi gói GB200 này sẽ gồm 360 CPU và 72 GPU, tất cả đều được sử dụng một bộ tản nhiệt nước lớn tích hợp bên trong. Hiệu năng của GB200 theo lý thuyết sẽ đạt tới 720 teraflop để training AI hoặc 1440 petaflop tốc độ tính toán xử lý. Chiều dài của cáp kết nối cũng cực dài khi tổng chiều dài đạt tới gần 5km cho khoảng 5000 cáp kết nối bên trong. Hiện tại đã có tin tức cho rằng Amazon, Google, Microsoft và Oracle đang "xếp hàng" để chờ mua những gói chip này phục vụ cho hệ thống điện toán đám mây của họ. Giá chính thức của Blackwell B200 sẽ có giá từ 30.000 USD đến 40.000 USD.
Cũng trong buổi hội nghị về GPU này, ngoài các sản phẩm và giải pháp về AI mà NVIDIA đưa ra thì chưa có thêm thông tin nào về các sản phẩm card màn hình dành cho game thủ. Tuy nhiên khả năng mà kiến trúc Blackwell được áp dụng cho thê hệ RTX 5000 Series trong tương lai sẽ là gần như chắc chắn.