Mô hình nhỏ, tác động lớn

Tháng Mười Hai 16 07:00 2025

CHLB ĐỨC – Trí tuệ công nghiệp của châu Âu cần sự đơn giản và khả năng kết nối mạng.

Các công nghệ ứng dụng thực tế tại các nhà máy
Tại hội chợ thương mại Hannover Messe, niềm đam mê công nghệ sẽ đối mặt với thực tế phức tạp của các nhà máy. Giữa những robot hình người và các trung tâm dữ liệu với quy mô cực lớn, có một sự thật thường bị bỏ qua là tiến bộ không được đo lường bằng cụm GPU (graphics processing unit) lớn nhất (*), mà bằng kiến ​​trúc tư duy, bằng sự tương tác của nhiều đơn vị nhỏ được kết nối mạng một cách hợp lý. Đây chính là thế mạnh của châu Âu: kỹ thuật (engineering), tư duy hệ thống (systems thinking) và lý trí (reason). Trong chủ đề chính của hội chợ, “Industrial transformation – Make it real” (tạm dịch là ‘Chuyển đổi công nghiệp – biến điều đó thành hiện thực’), điều này không có nghĩa là phải lớn hơn, mà là thông minh hơn.
(*) Cụm GPU lớn nhất: là một hệ thống máy tính bao gồm nhiều bộ xử lý đồ họa (GPU – graphics processing unit) được kết nối với nhau, để hoạt động như một đơn vị duy nhất, nhằm xử lý các tác vụ tính toán song song chuyên sâu với tốc độ cao hơn nhiều so với một bộ xử lý trung tâm (CPU – central processing unit) hoặc một GPU đơn lẻ.

Đồ thị thể hiện sự khác biệt giữa hai kiến trúc thông qua hai đại lượng: trục ngang biểu thị mức độ hợp tác (Kooperationsgrad) trong hệ thống, còn trục dọc cho thấy khả năng phục hồi hệ thống (Systemresilienz). Mô hình nguyên khối (Monolith) có mức hợp tác thấp và khả năng phục hồi trung bình, trong khi mạng SLM dạng agent (Agent-based SLM) đạt mức hợp tác cao hơn và khả năng phục hồi vượt trội.

Từ mô hình nguyên khối đến mô đun hóa: các mô hình ngôn ngữ nhỏ dạng agent trong ngành công nghiệp
Các mô hình ngôn ngữ lớn (LLM – large language model) đã đạt được những thành tựu đáng kinh ngạc, gồm kỹ năng ngôn ngữ phổ quát, tổng hợp sáng tạo, giải quyết vấn đề một cách thích ứng. Tuy nhiên, chúng sử dụng nhiều năng lượng, phức tạp và thường quá lớn so với môi trường sản xuất thực tế. Xu hướng ngược lại là các mô hình ngôn ngữ nhỏ (SLM – small language model): các mô hình nhỏ gọn, chuyên biệt, có thể chạy cục bộ, được đào tạo lại và kết hợp trong các kiến ​​trúc dạng agent (*). Chúng đồng thời xử lý dữ liệu, công nghệ cảm biến và ngôn ngữ, lý tưởng cho các lĩnh vực sản xuất, năng lượng, hậu cần và dịch vụ.
(*) Kiến trúc dạng agent (agentic architechture): là mô hình được xây dựng từ nhiều “tác nhân” (agent). Trong đó, agent là thành phần có thể tiếp nhận, xử lý thông tin và thực hiện tác vụ tự động mà không cần con người giám sát liên tục. Nhiều agent trong một kiến trúc có thể phối hợp với nhau để giải quyết các yêu cầu phức tạp. 

Đồ thị thể hiện xu hướng tăng trưởng của nguồn nhân lực AI chất lượng cao nhập cư vào Đức qua các năm. Trục ngang thể hiện năm, trong khi trục dọc biểu thị chỉ số so sánh (Index) dựa trên mốc năm 2018. Chỉ số tăng dần cho thấy Đức đang thu hút ngày càng nhiều chuyên gia AI có trình độ cao.

Tính bền vững là nguyên tắc hệ thống: một nhóm chỉ số KPI mới
Những khoản tiền lớn đang được đổ vào cơ sở hạ tầng công nghệ trí tuệ nhân tạo (AI – artificial intelligence) trên khắp thế giới. Nhưng trí tuệ công nghiệp thực sự không cần sự tối đa hóa, mà là tối ưu hóa. Các phân tích hàng đầu đang nâng cao tiêu chuẩn: Tính đơn giản, hiệu quả năng lượng, khả năng tái sử dụng, khả năng giải thích và khả năng phục hồi đang trở thành các chỉ số đo lường hiệu quả công việc (KPI – key performance indicator) chính, chứ không phải số lượng tham số hay số giờ sử dụng bộ xử lý đồ họa GPU. Điều này không chỉ hợp lý về mặt sinh thái mà còn vững chắc từ góc độ kinh doanh. Các chỉ số KPI chính mới này cho AI công nghiệp cụ thể là:
– Năng lượng trên mỗi lần suy luận (1)
– Khả năng giải thích
– Khả năng tái sử dụng
– Lưu trữ kiến ​​thức
– Con người tham gia vào vòng lặp (human-in-the-loop) (2)

(1) Năng lượng trên mỗi lần suy luận: đo lường lượng điện năng cần thiết để mô hình công nghệ AI đưa ra một dự đoán hoặc quyết định. Đây là thước đo trực tiếp cho hiệu quả năng lượng, giúp giảm chi phí vận hành và giảm dấu chân carbon.
(2) Con người tham gia vào vòng lặp: chỉ ra mức độ tích hợp và phụ thuộc vào sự can thiệp và kiểm soát của con người trong quá trình ra quyết định của công nghệ AI. Hệ thống human-in-the-loop đảm bảo rằng các quyết định quan trọng hoặc có độ rủi ro cao luôn được xác nhận hoặc hiệu chỉnh bởi con người, tăng cường tính an toàn và độ tin cậy.

Thiếu hụt kỹ năng, rò rỉ kiến ​​thức, và giá trị của kiến ​​thức tập trung và phi tập trung
Điểm nghẽn không chỉ nằm ở sức mạnh tính toán mà còn ở kiến ​​thức và kinh nghiệm. Sự thay đổi nhân khẩu học, luân chuyển nhân sự và thay đổi dự án khiến kiến ​​thức tiềm ẩn bị mất đi. Các hệ thống dạng agent có thể ổn định: chúng lưu giữ bối cảnh quy trình, quyết định và lộ trình học tập (một bộ nhớ kỹ thuật số của doanh nghiệp). Nguyên tắc ở đây là kiến ​​thức phi tập trung (kiến thức kinh nghiệm mang tính tình huống tại thời điểm hành động) bổ sung cho kiến ​​thức tập trung (tiêu chuẩn, hướng dẫn, thực tiễn tốt nhất được hợp nhất). Cả hai cùng nhau tăng cường khả năng phục hồi và tốc độ triển khai trong sản xuất.

Đồng thời, dòng chảy nhân lực đang dịch chuyển. Dữ liệu xu hướng cho thấy sự gia tăng nhập cư của nhân lực công nghệ AI trình độ cao vào CHLB Đức kể từ năm 2022, một phần nhờ vào các cải cách và các trường đại học/ hệ sinh thái tích cực thúc đẩy. Đây không phải là giải pháp tối ưu cho tình trạng thiếu hụt lao động có kỹ năng, nhưng là một tín hiệu đáng khích lệ cho địa điểm và hoạt động nghiên cứu.

Một lộ trình tiến hóa của phần cứng: sinh học phân tử (bio) – analog/ IMC (in-memory computing) – quang tử (photonics) – lượng tử (quantum)

Công nghiệp 4.1, từ bản song sinh kỹ thuật số đến hệ thống nhận thức
Các chủ đề của hội chợ Hannover Messe 2025, khả năng phục hồi, tính bền vững, chủ quyền, hội tụ trong khái niệm “cognitive industry” (tạm dịch là ‘ngành công nghiệp nhận thức’). Kiến trúc hybrid kết hợp các quy trình vật lý, bản song sinh kỹ thuật số và công nghệ trí tuệ nhân tạo (AI) đang nổi lên khắp nơi. Bảo trì, lập kế hoạch sản xuất, kiểm tra chất lượng hoặc tối ưu hóa năng lượng: mô hình ngôn ngữ nhỏ (SLM) dạng agent mang lại sự ổn định cho các quy trình thay vì chỉ tăng khối lượng dữ liệu. Các công ty đã ghi nhận rằng có ít cảnh báo hơn, thời gian khởi động ngắn hơn và trách nhiệm rõ ràng hơn.

Cuộc cách mạng thầm lặng trong phần cứng: analog, quang tử, sinh học và lượng tử
Trong khi phần mềm đang ngày càng trở nên phi tập trung, phần cứng đang trải qua một sự thay đổi đáng kể. Điện toán analog và điện toán trong bộ nhớ (in-memory computing) đang chuyển hướng các phép tính đến vị trí lưu trữ dữ liệu. Các kiến trúc quang tử tính toán bằng ánh sáng; các chất nền sinh học cho thấy các phương tiện vật lý có thể đóng vai trò như các máy tính lưu trữ. May mắn thay, các doanh nghiệp CHLB Đức đang tham gia định hình sự phát triển này, một vài công ty điển hình như: Q.ANT (quang tử), Akhehtonics (XPU hoàn toàn bằng quang học), Semron (mem-cap in-memory), BrainScaleS/EBRAINS (analog- thần kinh sinh học), cũng như Planqc, EleQtron, HQS và Munich Quantum Valley trong hệ sinh thái lượng tử.

Điện toán sinh học (bio-computing) đang phát triển mạnh mẽ: các mạng lưới sợi nấm (mycelium networks) (*) được sử dụng như các chất nền ghi nhớ sinh học (bio-memristive substrates), minh họa cách các cấu trúc hữu cơ có thể giải quyết hiệu quả các nhiệm vụ như các hệ thống hồ chứa. Mạng lưới nơ-ron thần kinh gai bổ sung cho điều này bằng cơ chế mã hóa thời gian và hiệu suất năng lượng cao.
(*) Mycelium networks: là mạng lưới các sợi nấm (như rễ cây nấm), có khả năng dẫn truyền tín hiệu điện và thay đổi độ dẫn điện của chúng theo thời gian và kích thích. Bio-memristive substrates: memristor là một thành phần điện tử có thể ghi nhớ điện tích đã truyền qua nó (có điện trở phụ thuộc vào lịch sử dòng điện).

Chu trình siêu cấp theo Eigen: các tác nhân hợp tác tạo ra tăng trưởng

Hợp tác như một quy luật tự nhiên: prigogine, chu trình siêu cấp (hypercycles) và AI tác nhân (agentic AI)
Lý thuyết hệ thống đặt nền tảng cho các kiến ​​trúc hợp tác. Nhà khoa học Ilya Prigogine đã chỉ ra rằng trật tự phát sinh từ sự dao động (đạt giải Nobel năm 1977). Nhà khoa học Manfred Eigen đã mô tả chu trình siêu cấp: một vòng lặp củng cố lẫn nhau, trong đó sự hợp tác làm tăng tính thích nghi của hệ thống (đạt giải Nobel năm 1967). Áp dụng vào công nghệ AI, điều này có nghĩa là nhiều đơn vị nhỏ với bản sắc mạnh mẽ, được gọi là nhận thức (cogniton), sẽ ổn định lẫn nhau thay vì tích lũy lỗi.

Các đòn bẩy của chính phủ và hệ sinh thái học tập: SPRIND, các bộ ngành, Open edX
Cơ quan Liên bang về đổi mới đột phá (SPRIND – Federal Agency for Breakthrough Innovations) tài trợ cho các phương pháp tiếp cận cấp tiến, từ quang tử và điện toán sinh học đến các hệ thống công nghệ AI mới. Bộ Nội vụ Liên bang (BMI – Bundesministerium des Innern und für Heimat) và Bộ Giao thông và Cơ sở hạ tầng kỹ thuật số Liên bang (BMDV – Bundesministerium für Digitales und Verkehr) đang thúc đẩy công nghệ AI hành chính và cơ sở hạ tầng kỹ thuật số. Nền tảng phần mềm mã nguồn mở Open edX là một ví dụ về giáo dục thường xuyên mở, có khả năng mở rộng: phi tập trung, mô-đun hóa, thực tế. Đối với ngành công nghiệp và doanh nghiệp vừa và nhỏ, điều này đồng nghĩa với việc tạo cầu nối giữa nghiên cứu, đào tạo chuyên môn và triển khai thực tế.

Các khuyến nghị cho người ra quyết định (cấp quản lý)
1. Xác định kiến trúc trước, ứng dụng sau: thiết kế hệ thống và chỉ tiêu KPI trước, sau đó mới là các ứng dụng minh họa.
2. SLM tại biên: sử dụng mô hình ngôn ngữ lớn (LLM) có chọn lọc (kiểm toán, tổng hợp), sử dụng mô hình ngôn ngữ nhỏ (SLM) hoạt động gần với quy trình.
3. Xây dựng kho lưu trữ kiến ​​thức: ứng dụng AI agent và các số liệu đo lường khả năng lưu giữ; giao diện tiêu chuẩn; tái sử dụng là một yêu cầu.
4.Lộ trình phần cứng: thí điểm sớm các công nghệ analog/ IMC/ quang tử, xác định lộ trình chi phí vận hành (OPEX – operating expenditure) trong 12–18 tháng.
5. Lộ trình nhân lực: hệ sinh thái học tập mở (Open edX), cơ chế nhập cư có tay nghề cao như thẻ xanh EU (blue card) và thẻ cơ hội (opportunity card) của CHLB Đức, các chương trình đào tạo kép với các trường đại học.

Kết luận. Trí tuệ với sự điều độ và cân bằng
Châu Âu không cần phải xây dựng những mô hình lớn nhất, mà là những hệ thống hợp lý nhất. Công nghệ AI mang tính tác nhân, phần cứng bền vững và kiến ​​trúc hợp tác đang kết nối lại ngành công nghiệp và tri thức, ổn định về kinh tế, bền vững về sinh thái và con người có thể hiểu được. Hội chợ thương mại Hannover Messe cho thấy rằng trí tuệ được kết nối mạng không còn là một viễn cảnh xa vời nữa, nó đang thực sự diễn ra.

Về tác giả
Tiến sĩ Johannes Nagele, Trưởng phòng Đổi mới tại Công ty Alexander Thamm.

Tiến sĩ Johannes Nagele là chuyên gia về công nghệ trí tuệ nhân tạo với hơn 15 năm kinh nghiệm trong lĩnh vực khoa học dữ liệu, phát triển phần mềm và học máy. Với nền tảng khoa học về vật lý sinh học và nghiên cứu não bộ, ông chịu trách nhiệm về đổi mới công nghệ AI tại công ty Alexander Thamm, và đóng vai trò chủ chốt trong việc thúc đẩy nghiên cứu, phát triển công nghệ và các dự án khách hàng. Trọng tâm của ông là các hệ thống đa tác tử (multi-agent systems) (1), bộ nhớ AI, học không giám sát (unsupervised learning) (2) và học tập hợp tác giữa con người và công nghệ AI (human-AI co-learning) (3). Với vai trò là nhà tư vấn, huấn luyện viên, diễn giả và người dẫn chương trình podcast “Nagele mit Köpfchen”, ông truyền đạt các nội dung phức tạp bằng tầm nhìn, tính ứng dụng thực tiễn và những phương pháp tiếp cận độc đáo, phá cách.
(1) Hệ thống đa tác tử: là một tập hợp các tác tử thông minh tương tác với nhau trong một môi trường chung để đạt được các mục tiêu chung hoặc riêng biệt. Trong đó, tác tử là một thực thể tự chủ (có thể là phần mềm hoặc phần cứng robot) có khả năng nhận thức môi trường, lý luận và hành động để đạt được mục tiêu.
(2) Học tập không giám sát: là một loại học máy, trong đó mô hình được cung cấp dữ liệu không được gán nhãn (ví dụ: hình ảnh mèo được đánh dấu là “mèo”). Mục tiêu của mô hình là tìm ra các mẫu, cấu trúc hoặc mối quan hệ ẩn bên trong dữ liệu đó một cách tự động.
(3) Học tập hợp tác giữa con người và công nghệ AI: đây là một mô hình học tập tiên tiến, trong đó con người và công nghệ AI cùng học hỏi lẫn nhau và cùng cải thiện hiệu suất của hệ thống. Cơ chế: Công nghệ AI học từ con người: AI học từ kinh nghiệm, tri thức tiềm ẩn, và sự điều chỉnh của chuyên gia con người (human-in-the-loop). Con người học từ công nghệ AI: con người sử dụng kết quả phân tích và dự đoán của công nghệ AI để hiểu rõ hơn về các quy trình phức tạp (ví dụ: AI giúp phát hiện ra một mối tương quan mà con người chưa từng nghĩ đến).

Để xem các tin bài khác về “Trí tuệ công nghiệp”, hãy nhấn vào đây.

 

Nguồn: Hannover Messe

Bình luận hay chia sẻ thông tin