Logo Logo
Tin công nghệ 29-06-2026

Qualcomm ra mắt lộ trình trung tâm dữ liệu với danh mục Dragonfly mới

Qualcomm Technologies (NASDAQ: QCOM) vừa công bố tại sự kiện Investor Day loạt giải pháp trung tâm dữ liệu mới, bao gồm CPU Qualcomm Dragonfly C1000, nền tảng Qualcomm High Bandwidth Compute (HBC), bộ tăng tốc suy luận Qualcomm Dragonfly AI300, các sản phẩm kết nối cùng các giải pháp silicon tùy biến. Tất cả được thiết kế nhằm tối đa hóa hiệu năng trên mỗi watt và thông lượng token, đồng thời giảm tổng chi phí sở hữu (TCO).

Danh mục Dragonfly mới đánh dấu bước tiến của Qualcomm trong việc xây dựng hạ tầng trung tâm dữ liệu AI toàn diện, từ CPU cho Agentic AI và trung tâm dữ liệu, bộ tăng tốc AI inference, kết nối hiệu năng cao đến các giải pháp silicon tùy chỉnh quy mô lớn. Dragonfly AI300 cũng gia nhập dòng sản phẩm AI accelerator của hãng bên cạnh AI200 và AI250 đã được công bố trước đó, trong khuôn khổ lộ trình phát triển bộ tăng tốc AI theo chu kỳ hàng năm.

Cristiano Amon, Chủ tịch kiêm CEO Qualcomm Incorporated, cho biết: "Agentic AI đang thúc đẩy nhu cầu AI inference trong trung tâm dữ liệu tăng mạnh. Khi inference trở thành khối lượng công việc chủ đạo, hạ tầng cần mang lại hiệu năng cao hơn với mức tiêu thụ điện năng và chi phí thấp hơn. Đây chính là thế mạnh của Qualcomm. Với Dragonfly, chúng tôi đưa năng lực điện toán hiệu năng cao, tiết kiệm năng lượng của mình vào trung tâm dữ liệu, cùng các thỏa thuận hợp tác đa thế hệ, dài hạn với những khách hàng hàng đầu."

Nền tảng tối ưu cho AI inference quy mô hyperscale

Qualcomm tận dụng nhiều thập kỷ kinh nghiệm trong thiết kế SoC, kiến trúc tiết kiệm điện, xử lý hiệu năng cao và sở hữu trí tuệ, kết hợp với việc đã xuất xưởng hơn 40 tỷ linh kiện, để xây dựng hạ tầng AI dạng rack-scale dành riêng cho các tác vụ Agentic AI inference trong trung tâm dữ liệu hyperscale.

Các nền tảng mới được tối ưu nhằm cải thiện hiệu quả chi phí trên mỗi token, giảm độ trễ, đơn giản hóa quá trình tích hợp, hỗ trợ triển khai quy mô lớn và giảm tổng chi phí sở hữu. Khi Agentic AI làm gia tăng nhu cầu xử lý token, Qualcomm tập trung tối ưu chỉ số tokens-per-watt như yếu tố quan trọng nhất để giảm TCO.

Tony Pialis, Phó Chủ tịch Điều hành kiêm Tổng Giám đốc mảng Data Center của Qualcomm Technologies, cho biết:

"Doanh nghiệp ngày nay cần nhiều hơn là các linh kiện riêng lẻ. Khả năng điều phối nhiều loại tài nguyên tính toán trên hạ tầng phân tán, hoạt động liên tục là yếu tố then chốt. Với Dragonfly, chúng tôi kết hợp điện toán, AI, bộ nhớ và kết nối vào một nền tảng rack-scale thống nhất, được thiết kế cho các tác vụ Agentic AI ngày càng phức tạp, đồng thời giải quyết những nút thắt về băng thông bộ nhớ và điện năng."

Qualcomm Dragonfly C1000 CPU

Dragonfly C1000 là CPU trung tâm dữ liệu được thiết kế dành riêng cho các tác vụ Agentic AI, AI head node và khối lượng công việc đa dụng, hướng tới hiệu năng trên mỗi watt và TCO hàng đầu.

Một số điểm nổi bật gồm:

  • Sử dụng nhân CPU Qualcomm Oryon tùy chỉnh, xung nhịp trên 5 GHz.
  • Thiết kế chiplet với hơn 250 nhân.
  • Hiệu năng trên mỗi watt được Qualcomm ước tính cao hơn hơn 2 lần so với các CPU máy chủ cạnh tranh hiện nay.
  • Kiến trúc hỗ trợ PCIe Gen 7 với băng thông trên 2 TB/s cùng CXL.
  • Hệ thống bộ nhớ tối ưu về băng thông, dung lượng, độ trễ và điện năng.
  • Hỗ trợ cả tản nhiệt bằng không khí và chất lỏng.
  • Tích hợp các tính năng RAS như ECC, cô lập lỗi và phục hồi lỗi.

CPU Dragonfly C1000 dự kiến thương mại hóa vào năm 2028.

Qualcomm High Bandwidth Compute (HBC)

HBC là kiến trúc tính toán gần bộ nhớ (near-memory computing) mới của Qualcomm, kết hợp khối xử lý với bộ nhớ băng thông cao thông qua công nghệ xếp chồng 3D nhằm giải quyết nút thắt về truyền dữ liệu trong AI.

Theo Qualcomm:

  • AI250 với HBC Gen 1 đạt 133 TB/s băng thông hiệu dụng trên mỗi card, cao gấp 18 lần AI200 sử dụng LPDDR5X.
  • AI300 với HBC Gen 2 tiếp tục nâng mức cải thiện lên 54 lần so với AI200.
  • HBC mang lại băng thông trên mỗi watt cao hơn 6 lần so với HBM.
  • Dung lượng trên mỗi watt cao hơn 200 lần so với SRAM ở cấp rack.

Qualcomm dự kiến bắt đầu gửi mẫu HBC Gen 1 cùng AI250 vào giữa năm 2027.

Qualcomm Dragonfly AI300

Dragonfly AI300 là nền tảng AI inference thế hệ thứ ba của Qualcomm, hỗ trợ cả làm mát bằng không khí và chất lỏng trực tiếp.

Nền tảng này tích hợp HBC Gen 2 nhằm tăng mạnh băng thông bộ nhớ hiệu dụng và hướng đến triển khai inference theo kiến trúc tách rời (disaggregated).

Một số điểm nổi bật:

  • Tối ưu cho các mô hình ngôn ngữ lớn (LLM), mô hình đa phương thức (LMM) và Agentic AI.
  • Hiệu năng trên mỗi watt dự kiến cao hơn 4-8 lần so với các kiến trúc GPU hiện nay ở khía cạnh băng thông bộ nhớ trên mỗi card.
  • Hỗ trợ UALink, Ethernet Scale-Up Networking cùng kết nối đồng và quang.

AI300 dự kiến bắt đầu gửi mẫu thương mại trong năm 2028.

Giải pháp silicon tùy biến và kết nối

Qualcomm cũng giới thiệu các giải pháp silicon tùy chỉnh dành cho hạ tầng AI và cloud thế hệ mới, bao gồm:

  • Thiết kế silicon theo yêu cầu cho Agentic AI.
  • Đồng thiết kế chip, hệ thống và phần mềm.
  • Kiến trúc mô-đun cùng công nghệ đóng gói tiên tiến.
  • Hỗ trợ từ thiết kế đến sản xuất hàng loạt.

Ở mảng kết nối, Qualcomm cung cấp danh mục giải pháp từ die-to-die, cáp đồng, quang học đến kết nối liên trung tâm dữ liệu, hỗ trợ tốc độ 800G1.6T, hướng tới giải quyết các nút thắt về truyền dữ liệu trong hạ tầng AI quy mô lớn.

Meta sẽ sử dụng CPU Dragonfly

Cùng với việc công bố danh mục Dragonfly, Qualcomm cũng thông báo ký kết thỏa thuận hợp tác chiến lược nhiều thế hệ với Meta.

Theo đó, CPU Qualcomm Dragonfly C1000 sẽ được sử dụng trong thế hệ máy chủ tiếp theo của Meta, đánh dấu bước tiến quan trọng của Qualcomm trong thị trường CPU trung tâm dữ liệu.

Hơn 35 đối tác tham gia hệ sinh thái

Qualcomm cho biết hơn 35 doanh nghiệp trong hệ sinh thái AI và bán dẫn đã bày tỏ sự ủng hộ đối với chiến lược trung tâm dữ liệu của hãng, bao gồm Advantest, Arista, Foxconn, GIGABYTE Technology, Lenovo, Micron, Samsung SDS, SK hynix America, Supermicro, UMC, Viettel IDC, VNPT Group cùng nhiều đối tác khác.

Qualcomm khẳng định sẽ tiếp tục theo đuổi lộ trình phát triển trung tâm dữ liệu đa thế hệ với chu kỳ ra mắt bộ tăng tốc AI hàng năm, tập trung vào ba mục tiêu chính: nâng cao hiệu năng AI inference, cải thiện hiệu quả năng lượng và giảm tổng chi phí sở hữu cho khách hàng.

Chia sẻ bài viết

Bình luận

( 0 bình luận )
Không có bình luận nào

Bình luận của bạn

Tin tức liên quan