Trước sự phát triển bùng nổ của trí tuệ nhân tạo (AI), nhu cầu về cơ sở hạ tầng mạnh mẽ, linh hoạt và hiệu quả càng trở nên cấp thiết. Để đáp ứng điều này, Intel đã giới thiệu hai giải pháp tiên tiến: bộ xử lý Xeon 6 với các nhân hiệu suất cao và bộ tăng tốc AI Gaudi 3. Hai sản phẩm này hứa hẹn giúp doanh nghiệp tối ưu hóa chi phí và triển khai nhanh chóng các ứng dụng AI với hiệu năng vượt trội.
Xeon 6 và Gaudi 3: Cải tiến về AI
Xeon 6 được trang bị các nhân P-core (hiệu suất cao), tăng gấp đôi khả năng xử lý so với thế hệ trước. Điểm đáng chú ý là việc tích hợp bộ tăng tốc AI ngay trong từng nhân, giúp xử lý tác vụ trí tuệ nhân tạo nhanh và hiệu quả hơn, từ thiết bị biên tới trung tâm dữ liệu và đám mây. Google Cloud đã xác nhận sẽ sớm cung cấp các giải pháp tích hợp Xeon 6, mang lại sự linh hoạt cao cho doanh nghiệp.
Gaudi 3, bộ tăng tốc AI thế hệ mới, được thiết kế tối ưu cho các mô hình AI sinh tạo (Generative AI) quy mô lớn. Với 64 nhân Tensor và 8 công cụ nhân ma trận, Gaudi 3 giúp cải thiện khả năng tính toán của mạng thần kinh nhân tạo. Sản phẩm còn tích hợp 128GB bộ nhớ HBM2e và 24 cổng Ethernet 200Gb, giúp mở rộng mạng một cách dễ dàng. Gaudi 3 cũng tương thích hoàn toàn với các framework AI phổ biến như PyTorch và mô hình transformer từ Hugging Face.
Hợp tác chiến lược với Google Cloud và IBM
Intel không chỉ dừng lại ở việc cung cấp phần cứng mà còn hợp tác chiến lược với các công ty hàng đầu như Google Cloud và IBM để tối ưu hóa các giải pháp AI. Với sự hợp tác này, Intel và IBM hướng đến giảm tổng chi phí sở hữu (TCO) cho doanh nghiệp, đồng thời nâng cao hiệu năng và khả năng mở rộng quy mô AI. IBM sẽ sử dụng Gaudi 3 để cung cấp các dịch vụ AI cho khách hàng, giúp doanh nghiệp dễ dàng khai thác tiềm năng của AI trong môi trường sản xuất quy mô lớn.
Đẩy mạnh hạ tầng AI Vvới Intel và các đối tác
Intel đang hợp tác với các OEM lớn như Dell Technologies và Supermicro, đồng thiết kế các hệ thống AI nhằm giải quyết nhu cầu đa dạng của doanh nghiệp. Sự hợp tác này không chỉ giúp nâng cao hiệu quả triển khai AI mà còn mang lại giải pháp tối ưu hơn về mặt chi phí và khả năng bảo mật. Bên cạnh đó, nền tảng x86 mạnh mẽ của Intel cũng là yếu tố then chốt, giúp xây dựng các hệ thống AI giá trị cao với tổng chi phí sở hữu và hiệu năng sử dụng điện tối ưu.
Từ nguyên mẫu đến hệ thống sản xuất
Triển khai các giải pháp AI sinh tạo trên quy mô lớn luôn là một thách thức đối với doanh nghiệp. Intel đang giải quyết các vấn đề về giám sát thời gian thực, xử lý lỗi, bảo mật và khả năng mở rộng thông qua nỗ lực hợp tác với các OEM và đối tác. Các giải pháp AI sinh tạo dựa trên hệ thống retrieval-augmented generation (RAG) của Intel, được xây dựng trên Nền Tảng Mở dành cho AI Doanh Nghiệp (Open Platform for Enterprise AI – OPEA), giúp các doanh nghiệp dễ dàng chuyển đổi từ nguyên mẫu sang hệ thống sản xuất.
Khả năng truy xuất AI cao cấp với danh mục Tiber
Intel cũng đang mở rộng khả năng truy xuất AI trong doanh nghiệp thông qua danh mục Tiber. Các giải pháp này giúp giải quyết nhiều thách thức về chi phí, bảo mật, và khả năng mở rộng AI trong môi trường điện toán đám mây và thiết bị vùng biên. Intel Tiber Developer Cloud hiện cung cấp hệ thống thử nghiệm Xeon 6, cho phép doanh nghiệp đánh giá và thử nghiệm trước khi triển khai chính thức. Một số doanh nghiệp còn được tiếp cận sớm Gaudi 3 để xác thực các phương án triển khai mô hình AI trước khi các cụm Gaudi 3 được triển khai rộng rãi trong quý tới.
Nhiều dịch vụ AI mới đang được giới thiệu
Trong tương lai gần, Intel sẽ ra mắt nhiều dịch vụ AI mới, nổi bật là nền tảng SeekrFlow – một giải pháp AI toàn diện giúp phát triển các ứng dụng AI đáng tin cậy. Các bản cập nhật phần mềm mới nhất như Synpase, Jupyter notebook cài sẵn PyTorch 2.4 và Intel oneAPI, cùng các công cụ AI mới sẽ hỗ trợ các bộ xử lý Xeon 6, mang lại tính năng AI vượt trội và hiệu quả hơn cho doanh nghiệp.