[Video] Nền tảng khoa học dữ liệu cho mọi người

Tháng Năm 02 08:00 2024

MỸ – Nền tảng khoa học dữ liệu RapidMiner 2023 của công ty Altair cung cấp các khả năng công nghệ trí tuệ nhân tạo (AI) tổng hợp thế hệ tiếp theo.

Altair, một công ty hàng đầu thế giới về khoa học máy tính và công nghệ trí tuệ nhân tạo (AI), đã tuyên bố rằng nền tảng công nghệ trí tuệ nhân tạo (AI) và phân tích dữ liệu Altair RapidMiner của họ tích hợp tốt hơn, mạnh mẽ hơn và thân thiện với người dùng hơn nhờ một loạt các cải tiến đột phá mới.

Truy cập thân thiện với công nghệ trí tuệ nhân tạo (AI) và phân tích dữ liệu
Ông Sam Mahalingam, Giám đốc Công nghệ tại công ty Altair cho biết: “Những cải tiến đối với nền tảng khoa học dữ liệu RapidMiner tạo ra một cấp độ chất lượng mới và củng cố vị trí như một giải pháp toàn diện, và độc đáo trong lĩnh vực phân tích dữ liệu và công nghệ trí tuệ nhân tạo (AI). Nền tảng Altair RapidMiner cung cấp cho người dùng mọi nền tảng đào tạo và chức năng kinh doanh với quyền truy cập mạnh mẽ và dễ sử dụng vào công nghệ trí tuệ nhân tạo (AI) và phân tích dữ liệu, với cách tiếp cận ít mã và không mã lập trình, giúp nó thành một hệ sinh thái độc đáo cho các doanh nghiệp thuộc tất cả các ngành công nghiệp, để giúp họ giảm thiểu các vấn đề khó khăn và đẩy nhanh quá trình chuyển đổi kỹ thuật số.”

Nền tảng Altair_RM

Công cụ hiện đại mới để tích hợp mô hình ngôn ngữ lớn (LLM) vào ứng dụng doanh nghiệp
Các giải pháp được tích hợp trong hệ sinh thái nền tảng Altair RapidMiner được thiết kế nhằm cho phép tổng hợp các ứng dụng công nghệ trí tuệ nhân tạo (AI), giúp người dùng đơn giản hóa quy trình công việc và tạo các phiên bản tùy chỉnh theo hướng ứng dụng của các mô hình ngôn ngữ lớn (LLM)* như ChatGPT bằng dữ liệu của riêng họ.
* LLM (Large language models): là mô hình ngôn ngữ lớn, để chỉ các mô hình xác suất có khả năng hiểu và sinh ngôn ngữ tự nhiên dựa trên kiến thức được thu thập từ các tệp dữ liệu cực lớn.

Ví dụ, các tổ chức toàn cầu sẽ có thể tạo ra một phiên bản ChatGPT được điều chỉnh chính xác theo danh mục, các loại sản phẩm, ứng dụng và khách hàng của họ. Ngoài ra, nền tảng Altair RapidMiner tận dụng API* của ChatGPT để người dùng có thể thực hiện các tùy chỉnh sâu hơn mà không cần phải viết một dòng mã nào. Ngoài ra, người dùng có thể truy cập tất cả 300.000 mô hình của công ty Hugging Face chỉ bằng một cú nhấp chuột và điều chỉnh các mô hình với hàng tỷ tham số. Nền tảng Altair RapidMiner cũng sử dụng mô hình ngôn ngữ lớn (LLM) để nâng cao trải nghiệm người dùng: Người dùng chỉ cần xác định các chuyển đổi dữ liệu mong muốn và phần mềm sẽ tự động tạo quy trình công việc phù hợp.
* API: cho phép các doanh nghiệp tích hợp công nghệ ChatGPT vào các ứng dụng, trang web, sản phẩm và dịch vụ của họ.


Nâng cao khả năng phát triển để mọi người dễ tiếp cận khoa học dữ liệu
Bộ công cụ máy học tự động (AutoML)* toàn diện của nền tảng Altair RapidMiner hỗ trợ nhóm tự động ngoài việc tạo mô hình dự đoán, kỹ thuật tính năng và dự báo chuỗi thời gian. Giao diện người dùng dựa trên trình hướng dẫn trực quan cho phép các kỹ thuật viên mới làm quen với máy học tạo ra các mô hình sẵn sàng sử dụng. Phần mềm đơn giản hóa đáng kể việc triển khai và xử lý các mô hình dự đoán AutoML làm điểm cuối API REST. Với các cài đặt được cấu hình sẵn của nền tảng Altair RapidMiner, những kỹ thuật viên không phải là chuyên gia như nhà phân tích dữ liệu và nhà khoa học dữ liệu, có thể triển khai và tích hợp các mô hình máy học chỉ trong vài giây.
* AutoML (Automated machine learning), hay máy học tự động, là một công nghệ giúp việc học máy trở nên dễ tiếp cận và hiệu quả hơn. 

Công cụ tạo cây quyết định dễ hiểu
Ngoài ra, nền tảng Altair RapidMiner còn cung cấp một công cụ dựa trên trình hướng dẫn để tạo ra các cây quyết định độc đáo, được cấp bằng sáng chế và dễ hiểu. Điều này cho phép người dùng không có nền tảng khoa học dữ liệu, có thể hình dung và hiểu các tương tác phức tạp trong các tệp dữ liệu. Người dùng có thể tự động tạo cây quyết định, tìm các nhánh tốt nhất, xóa nhánh và lưu quy trình tính điểm.

Tích hợp tối ưu cho ngôn ngữ lập trình khoa học dữ liệu SAS, Python và R
Nền tảng Altair RapidMiner cũng bao gồm Altair SLC, một môi trường ngôn ngữ lập trình* SAS thay thế, với môi trường phát triển được tích hợp đầy đủ và các công cụ ít mã và không mã để hỗ trợ các khả năng phân tích nâng cao, năng suất cao và chu kỳ phát triển và triển khai ngắn. Môi trường ngôn ngữ lập trình Altair SLC được thiết kế để giúp các doanh nghiệp dễ dàng chuyển sang nền tảng phân tích linh hoạt, hiện đại với tác động tối thiểu đến hoạt động của họ. API Python được cải tiến cho phép người dùng kiểm tra và chạy mã ngôn ngữ SAS trong môi trường phát triển ngôn ngữ Python của họ.
* Ngôn ngữ lập trình: là ngôn ngữ hình thức bao gồm một tập hợp các lệnh tạo ra nhiều loại đầu ra khác nhau. Ngôn ngữ lập trình được sử dụng trong lập trình máy tính để thực hiện các thuật toán. Hầu hết các ngôn ngữ lập trình bao gồm các lệnh cho máy tính.

Mô hình phát triển mới cho nhà phát triển ngôn ngữ lập trình khoa học dữ liệu Python
Nền tảng Altair RapidMiner tạo ra một mô hình phát triển mới cho nhà phát triển ngôn ngữ lập trình Python trong Altair AI Cloud với các khả năng không gian làm việc mới. Phát triển mã tương tác trong các không gian làm việc, cho phép người dùng sử dụng một môi trường phát triển tích hợp (IDE)* tiêu chuẩn để phát triển mã Python sẵn sàng sử dụng dựa trên ngôn ngữ Python hiện có và được quản lý trung tâm. Để chạy mã của mình, người dùng có thể dễ dàng chỉ định và kích hoạt các dữ liệu phân tích theo nhu cầu, bao gồm lựa chọn phần cứng GPU cho các tác vụ mô hình phức tạp như xử lý ảnh, mô hình ngôn ngữ lớn (LLM) hoặc các chức năng tương tự.
* IDE: là môi trường phát triển tích hợp, là một ứng dụng phần mềm hỗ trợ lập trình viên phát triển mã phần mềm một cách hiệu quả.

Công cụ mới, mạnh mẽ nhằm trực quan hóa hàng tồn kho và dữ liệu thời gian thực
Altair Panopticon, giải pháp phân tích trực tuyến và trực quan hóa dữ liệu trong nền tảng Altair RapidMiner, cung cấp một thế hệ mới các yếu tố trực quan, mẫu bố cục và công cụ, cũng như các tùy chọn cài đặt giúp việc tạo, xuất bản và sử dụng bảng điều khiển trực quan hơn bao giờ hết với giao diện người dùng được tinh giản. Với những cải tiến này, nhà phát triển ứng dụng có thể thiết lập nhanh hơn và có nhiều thời gian hơn cho việc tạo và cung cấp các bảng điều khiển hấp dẫn, dễ hiểu.

Khám phá những hiểu biết mới
Ngoài ra, các nhà phân tích có thể đánh giá tốt hơn các tệp dữ liệu lớn, phức tạp và thay đổi nhanh chóng, phát hiện các điểm bất thường và nhanh chóng thu thập những hiểu biết mới từ dữ liệu của họ. Nền tảng phân tích dữ liệu Panopticon sử dụng bộ nhớ đệm để hiển thị dữ liệu trực tuyến mà không cần lưu vào bộ nhớ đệm – bao gồm dữ liệu đám mây, dữ liệu tệp, dữ liệu lớn và dữ liệu truyền phát. Bằng cách sử dụng kết hợp dữ liệu trong bộ nhớ để hợp nhất và kết hợp dữ liệu từ các nguồn khác nhau, nền tảng Panopticon cho phép người dùng trực quan hóa nhiều điểm dữ liệu hơn bao giờ hết. Nhờ các khả năng quản trị dữ liệu, người dùng có thể truy cập vào cùng một bảng điều khiển, nhưng với nội dung dữ liệu được cá nhân hóa. Người dùng cũng có thể chuyển đổi liền mạch giữa các hệ thống dựa trên trình duyệt khác trong công cụ.

Trích xuất và chuẩn bị dữ liệu được cấp bằng sáng chế
Với việc bổ sung nền tảng Altair Monarch, công ty Altair tiếp tục duy trì thành tích hơn 30 năm thành công trong lĩnh vực trích xuất và chuẩn bị dữ liệu. Người dùng sẽ được hưởng lợi từ hiệu suất và bảo mật nâng cao, bao gồm hỗ trợ đọc/ ghi trực tiếp cho các ứng dựng Azure Blob Storage, Google Cloud Storage, Oracle Cloud Storage và Azure Active Directory. Với chức năng PDF-to-Excel (chuyển dữ liệu và nội dung trong tệp PDF sang bảng tính Excel có thể chỉnh sửa) tiên tiến và khả năng trích xuất báo cáo kế toán của hệ thống ngân hàng và kế toán, nền tảng Monarch tiếp tục dẫn đầu thị trường.

Để xem các tin bài khác về “Khoa học dữ liệu”, vui lòng nhấn vào đây.

 

Nguồn: Hannover Messe

Bình luận hay chia sẻ thông tin