Sự cạnh tranh và tiến hóa của chip AI: từ GPU đến ASIC và NPU

Tháng Sáu 20 13:00 2026

Sự bùng nổ của trí tuệ nhân tạo trong những năm gần đây không chỉ được thúc đẩy bởi thuật toán hay dữ liệu, mà còn phụ thuộc ngày càng lớn vào hạ tầng phần cứng phía sau. Từ các GPU thống trị của Nvidia đến làn sóng chip tùy chỉnh do Google, Amazon và Microsoft phát triển, cuộc đua chip AI đang bước vào giai đoạn cạnh tranh toàn diện.

Trong bài viết lần này, ban biên tập technologyMAG chia sẻ video của kênh CNBC, nói về sự cạnh tranh và phát triển trong lĩnh vực chip AI toàn cầu.


Để xem và hiểu đầy đủ nội dung của video (bằng tiếng Anh), Quý độc giả vui lòng tham khảo nội dung của bài viết. Để xem video ở chế độ toàn màn hình (full-screen), vui lòng nhấn vào khung [ ] tại góc phải phía dưới của video hoặc nhấn phím F.

GPU của Nvidia và sự bùng nổ của chip AI
Các bộ xử lý đồ họa (GPU) của Nvidia, bao gồm dòng Blackwell mới nhất, hiện đang được triển khai trong các rack máy chủ trên toàn cầu, phản ánh quá trình chuyển mình của công ty từ một doanh nghiệp tập trung vào gaming trở thành lực lượng trung tâm trong lĩnh vực AI tạo sinh. Những GPU này được sử dụng để huấn luyện mô hình, vận hành khối lượng công việc và đã góp phần đẩy định giá của Nvidia tăng mạnh, với 6 triệu GPU Blackwell được xuất xưởng trong năm qua.

Trong các hệ thống quy mô lớn, có thể kết nối tới 72 GPU để hoạt động như một đơn vị duy nhất, đủ khả năng xử lý các tác vụ AI tiên tiến. GPU vẫn là nền tảng tính toán đa dụng chủ đạo trong AI, nhưng một nhóm sản phẩm khác, ASIC tùy chỉnh (application-specific integrated circuits) (1), đang tăng trưởng nhanh chóng.
(1) ASIC tùy chỉnh (Custom ASIC) là một loại chip được thiết kế chỉ để thực hiện một nhiệm vụ cụ thể, thay vì dùng cho nhiều mục đích khác nhau.

Các tập đoàn lớn như Google, Amazon, Meta, Microsoft và OpenAI đang thiết kế các chip này, thường hợp tác với các công ty như Broadcom. ASIC có kích thước nhỏ hơn, chi phí thấp hơn và được tối ưu cho một mục đích cụ thể, và thị trường này được dự báo sẽ tăng trưởng nhanh hơn GPU trong những năm tới. Ngoài ra, hệ sinh thái chip AI còn bao gồm FPGA (2) và nhiều loại chip phục vụ AI biên (Edge AI) (3), cho thấy mức độ đa dạng và cạnh tranh ngày càng cao của lĩnh vực này.
(2) FPGA (Field-Programmable Gate Array) là một loại vi mạch có thể được cấu hình lại sau khi sản xuất, cho phép người dùng thiết kế và triển khai các mạch logic tùy chỉnh trực tiếp trên phần cứng. Khác với CPU hay GPU vốn chạy phần mềm trên một kiến trúc cố định, FPGA cho phép định nghĩa lại cách các khối logic bên trong chip được kết nối và hoạt động, từ đó tạo ra một kiến trúc xử lý phù hợp với từng bài toán cụ thể.
(3) Edge AI đề cập đến việc tích hợp và thực thi các mô hình trí tuệ nhân tạo ngay trên các thiết bị đầu cuối như camera, cảm biến, thiết bị IoT, điện thoại thông minh hoặc hệ thống nhúng, thay vì phụ thuộc hoàn toàn vào hạ tầng điện toán đám mây. Cách tiếp cận này cho phép dữ liệu được xử lý tại chỗ với độ trễ thấp hơn, giảm nhu cầu truyền tải dữ liệu lớn qua mạng và cải thiện quyền riêng tư khi thông tin nhạy cảm không cần rời khỏi thiết bị.

Vì sao GPU trở thành nền tảng của trí tuệ nhân tạo?
Sự thống trị của GPU trong AI bắt nguồn từ khả năng xử lý song song, vốn được thiết kế ban đầu để dựng hình đồ họa bằng cách tính toán đồng thời nhiều điểm ảnh. Khả năng này đặc biệt phù hợp với mạng nơ-ron, điều đã được chứng minh vào năm 2012 với AlexNet – mô hình đạt độ chính xác vượt trội trong nhận diện hình ảnh nhờ tận dụng GPU.

Không giống CPU chỉ có một số lượng nhỏ lõi mạnh chuyên xử lý tuần tự, GPU sở hữu hàng nghìn lõi nhỏ được tối ưu cho các phép toán song song như nhân ma trận trên tensor (4). Điều này khiến GPU đặc biệt hiệu quả cho hai giai đoạn chính của AI là huấn luyện (training) và suy luận (interfere).
(4) Tensor là một cấu trúc dữ liệu toán học dùng để biểu diễn dữ liệu nhiều chiều – có thể xem như một dạng tổng quát của số, vector và ma trận. 

Huấn luyện là quá trình giúp mô hình học từ dữ liệu lớn, trong khi suy luận là quá trình sử dụng mô hình để đưa ra quyết định từ dữ liệu mới. Các ứng dụng AI hàng ngày, từ ứng dụng di động đến phần mềm doanh nghiệp, chủ yếu dựa vào suy luận. Nvidia bán GPU trực tiếp cho các công ty AI và chính phủ, cũng như cho các nhà cung cấp đám mây để cho thuê theo thời gian sử dụng. Với nhu cầu cao, một hệ thống Blackwell 72 GPU có giá khoảng 3 triệu USD, và Nvidia đang xuất xưởng khoảng 1.000 hệ thống mỗi tuần, đồng thời tập trung vào việc bán trọn hệ thống thay vì chỉ chip riêng lẻ.

Cạnh tranh GPU và sự trỗi dậy của ASIC
Cạnh tranh trong lĩnh vực này đang gia tăng nhanh chóng. Công ty AMD đã đạt được tiến triển đáng kể với dòng GPU Instinct và tận dụng hệ sinh thái phần mềm mã nguồn mở, trong khi Nvidia dựa vào nền tảng CUDA độc quyền. Khi các mô hình AI trưởng thành, nhu cầu suy luận tăng lên, tạo điều kiện cho các chip chuyên dụng phát triển.

ASIC tùy chỉnh, dù kém linh hoạt hơn GPU, lại có hiệu suất và hiệu quả năng lượng cao hơn cho các tác vụ cụ thể. Tuy nhiên, chi phí phát triển rất lớn – thường lên tới hàng chục hoặc hàng trăm triệu USD, khiến chỉ các tổ chức lớn mới có khả năng đầu tư. Google là đơn vị tiên phong với TPU (5) ra mắt năm 2015, đồng thời góp phần phát triển kiến trúc transformer vào năm 2017. Amazon Web Services tiếp nối với các dòng chip AI là Inferentia và Trainium, hiện được triển khai ở quy mô lớn trong các trung tâm dữ liệu. Những dự án này thường có sự hỗ trợ từ các đối tác như Broadcom và Marvell, cung cấp năng lực thiết kế và hạ tầng.
(5) TPU (Tensor Processing Unit) là một loại chip tăng tốc AI được thiết kế chuyên biệt để xử lý các phép toán trên tensor – đặc biệt là các phép nhân ma trận và tích chập trong học sâu (deep learning).

Sự mở rộng của hệ sinh thái chip AI
Nhiều công ty khác cũng đang tham gia phát triển ASIC, bao gồm Microsoft với chip Maia, Intel với dòng Gaudi, Tesla và Qualcomm. Các startup như Cerebras và Groq cũng đang thúc đẩy đổi mới với các kiến trúc chuyên biệt.

Song song đó, AI biên đang ngày càng quan trọng, cho phép chạy mô hình trực tiếp trên thiết bị như điện thoại, laptop và ô tô. Điều này được thực hiện thông qua NPU – bộ xử lý thần kinh tích hợp trong SoC (6), mang lại khả năng xử lý AI hiệu quả với chi phí thấp mà không cần kết nối đám mây. Các công ty như Qualcomm, Intel, AMD và Apple đang dẫn đầu xu hướng này, tích hợp AI vào thiết bị tiêu dùng để cải thiện quyền riêng tư, độ phản hồi và khả năng kiểm soát.
(6) SoC (System on a Chip) là một vi mạch tích hợp toàn bộ các thành phần chính của một hệ thống máy tính vào trong một con chip duy nhất.

FPGA và sản xuất chip toàn cầu
FPGA cung cấp một lựa chọn linh hoạt hơn, cho phép cấu hình lại sau khi sản xuất để phục vụ nhiều ứng dụng khác nhau, dù kém hiệu quả hơn ASIC trong các khối lượng công việc AI lớn. AMD trở thành nhà cung cấp FPGA lớn nhất sau khi mua lại công ty Xilinx, trong khi Intel giữ vị trí quan trọng thông qua công ty Altera.

Dù có nhiều loại chip khác nhau, phần lớn đều được sản xuất bởi Taiwan Semiconductor Manufacturing Company – TSMC, tạo ra một phụ thuộc địa chính trị đáng kể. Các nỗ lực đa dạng hóa đang được triển khai, với các nhà máy mới tại Arizona được hỗ trợ bởi chính phủ, và các công ty như Apple và Nvidia bắt đầu chuyển một phần sản xuất sang Mỹ.

Yếu tố địa chính trị và tương lai của AI
Các công ty Trung Quốc như Huawei, ByteDance và Alibaba cũng đang phát triển chip riêng, nhưng bị hạn chế bởi các quy định kiểm soát xuất khẩu đối với công nghệ tiên tiến. Bên cạnh thiết kế chip, nguồn điện trở thành yếu tố then chốt, do các trung tâm dữ liệu AI tiêu thụ năng lượng khổng lồ.

Mặc dù Mỹ đang dẫn đầu về công nghệ chip, việc duy trì vị thế này phụ thuộc vào khả năng giải quyết bài toán năng lượng. Dù cạnh tranh ngày càng gia tăng, Nvidia vẫn giữ lợi thế lớn nhờ hệ sinh thái đã được xây dựng qua nhiều năm, nhưng quy mô thị trường AI đang mở rộng nhanh chóng và sẽ tiếp tục thu hút thêm nhiều đối thủ mới trong tương lai.

Kết luận
Hệ sinh thái chip AI đang phát triển nhanh chóng với sự đa dạng ngày càng lớn về kiến trúc và cách tiếp cận. GPU vẫn giữ vai trò trung tâm nhờ tính linh hoạt và khả năng xử lý song song, nhưng các chip chuyên dụng như ASIC, cùng với xu hướng AI biên và NPU, đang dần thay đổi cách các hệ thống AI được xây dựng và tối ưu. Cuộc cạnh tranh không còn giới hạn ở các nhà sản xuất chip như Nvidia hay Advanced Micro Devices, mà đã mở rộng sang cả Google, Amazon và Microsoft, những bên đang chủ động thiết kế phần cứng riêng để kiểm soát chi phí và hiệu năng.

Trong khi đó, các yếu tố như năng lực sản xuất tập trung tại TSMC và nhu cầu năng lượng khổng lồ của trung tâm dữ liệu đang trở thành những ràng buộc chiến lược quan trọng. Dù Nvidia vẫn dẫn đầu nhờ hệ sinh thái mạnh, quy mô thị trường AI ngày càng mở rộng sẽ tiếp tục thu hút thêm nhiều đối thủ mới, thúc đẩy đổi mới và đưa AI từ hạ tầng đám mây lan rộng ra thiết bị cá nhân và các ứng dụng thực tế trong tương lai.

Để xem các tin bài khác về “Chip AI”, hãy nhấn vào đây.

 

Nguồn: CNBC

Bình luận hay chia sẻ thông tin