Pages

Thứ Hai, 4 tháng 11, 2024

Phân tích kỹ thuật vi xử lý máy chủ Intel Xeon 6900P - Phần 2

Sau khi đi qua nội dung về lịch sử và những thông tin sơ bộ về mảng sản phẩm vi xử lý Xeon cho thị trường máy chủ, phần này chúng ta sẽ bàn về chi tiết cụ thể thiết kế bên trong của Intel Xeon 6900P, kiến trúc, hiệu năng và nhận định.

Die compute và die I/O


Intel không chỉ khác AMD trong tư duy chiplet, mà còn khác cả tư duy về cấu trúc của từng die. Trong khi CCD của AMD thuần tuý chỉ có nhân xử lý và bộ đệm, thì die compute bên Intel có thêm cả trình điều khiển bộ nhớ (IMC). Bên cạnh đó do số lượng nhân xử lý rất nhiều (tối thiểu 16 nhân), Intel sắp xếp chúng theo dạng lưới (mesh) liên kết như ma trận. Có điều công ty này không công bố diagram die compute nên không rõ cấu hình cụ thể như thế nào (4x4 hay 8x2 hay 16x4 hay 8x8).

Lộ diện chip Clearwater Forest, dây chuyền Intel 18A sẵn sàng sản xuất hàng loạt

Clearwater Forest sẽ là dòng sản phẩm kế tiếp dành cho thị trường máy chủ (E-Cores). Hình ảnh của con chip mới lộ diện ở sự kiện ra mắt Intel Xeon 6 P-Cores là dấu hiệu cho thấy dây chuyền công nghệ Intel 18A đã sẵn sàng đi vào sản xuất hàng loạt.
tinhte.vn


Tuy nhiên điểm cần nhớ là từng die compute sẽ nhận trực tiếp dữ liệu từ bộ nhớ RAM thông qua IMC có sẵn, chứ không phải thông qua die I/O như trường hợp của AMD. Do đó về lý thuyết, Intel sẽ chủ động được vấn đề bộ nhớ tốt hơn AMD (tốc độ truy cập RAM bên AMD bị lệ thuộc vào tốc độ Infinity Fabric). Việc Intel hỗ trợ bộ nhớ MRDIMM có băng thông tới 8800 MT/s là kết quả của thiết kế này (sweet spot của AMD vẫn là DDR5-6000). Die compute Granite Rapids được sản xuất trên tiến trình Intel 3 gần như là mới nhất của Intel lúc này (Intel 18A đang dùng để sản xuất Clearwater Forest nhưng là sản phẩm của năm sau).

Intel Xeon 6 chiplet.jpg
Cấu tạo của die compute và die I/O

Với die I/O, trừ việc không có IMC như bên AMD thì chức năng còn lại tương tự. Những giao tiếp nào "đi ra ngoài" CPU đều do 2 die I/O nắm giữ (UPI, PCIe, CXL...). Cũng vì vai trò đơn giản hơn nên die I/O được sản xuất trên tiến trình Intel 7 (hoặc 10 nm).

Khác biệt cuối cùng giữa Intel và AMD (đúng hơn là TSMC) là các liên kết die được thực hiện qua các cầu EMIB do Intel tự phát triển, chứ không phải interposer. Không rõ liệu Gaudi 3 đang dùng công nghệ liên kết die nào nhưng nhiều khả năng cũng là interposer vì 2 thế hệ Gaudi trước cũng được sản xuất bởi TSMC. Chúng ta sẽ có bài nói sâu hơn về 2 công nghệ đóng gói chip này trong dịp khác.

MRDIMM, CXL 2.0 và mô hình bộ nhớ trên Xeon 6


Một trong những nét có thể nói là độc nhất của Granite Rapids mà chưa từng con chip nào khác có là MRDIMM. Vì đây là chuẩn bộ nhớ mới nên tên gọi của nó chưa được thống nhất giữa các hãng, chúng ta cứ tạm gọi là bộ nhớ DIMM Chồng Rank (Multiplexed Rank DIMM). Trong đó khác với DIMM truyền thống chỉ có 1 rank đang được dùng phổ biến hiện nay với đường dữ liệu 64-bit, MRDIMM "chồng" 2 rank lại với nhau cho phép tải cùng lúc tới 128-bit.

Intel MRDIMM.jpg
micron-DDR5-MRDIMM-group-half-height-tall-form.jpg
MRDIMM không chỉ cho băng thông cao hơn mà dung lượng trên từng DIMM cũng lớn hơn

Theo tiêu chuẩn JEDEC, MRDIMM sẽ có 3 phiên bản Gen 1, 2 và 3 với băng thông lần lượt là 8800, 12800 và 17600 MT/s. Loại MRDIMM được hỗ trợ trên Granite Rapids là Gen 1. Ngoài vấn đề tăng cường băng thông ra, MRDIMM còn cho phép "nhồi nhét" được nhiều chip nhớ hơn trên cùng một khe DIMM. Vì cơ bản mà nói, MRDIMM giống như 2 thanh DDR5 nhưng "nhét" chung 1 slot DIMM. Đây là giải pháp cho những ứng dụng cụm server yêu cầu nặng về bộ nhớ RAM, bên cạnh những ứng dụng thông thường khác.

Quảng cáo


Được biết AMD cũng đã công khai hỗ trợ MRDIMM ở hội nghị MemCon 2023, nhưng trên sản phẩm cụ thể nào thì chưa rõ.

Intel Xeon 6 CXL 01.jpg
Intel Xeon 6 CXL 02.jpg
Cách thức CXL hoạt động

Marvell-Structera-X-2504-2.jpg
Inventec-CXL-Box-OCP-Summit-2024-7.jpg
Một số sản phẩm nâng cấp bộ nhớ RAM dựa trên chuẩn CXL

Và nói tới MRDIMM thì không thể không nhớ tới CXL hay Compute Express Link. Về cơ bản đây là giải pháp giúp cải thiện hơn nữa khả năng lưu trữ của server dựa trên giao tiếp PCIe, mà RAM là chủ yếu. Với người dùng PC chuyện có thật nhiều RAM có thể không quá quan trọng nhưng ở server mà nói, chi phí mua RAM đôi khi gấp mấy lần chi phí sắm CPU! Với CXL, "dân chơi" RAM hoàn toàn có thể sắm thêm một đống card PCIe hay thậm chí là nguyên một cụm rack chỉ để... cắm RAM! Nhưng điều tuyệt vời nhất ở CXL là loại RAM mà những card/rack này chạy không bắt buộc phải cùng loại được CPU hỗ trợ. Bạn có thể vừa xài cả DDR5 trên DIMM lẫn DDR4 trên card CXL và mọi thứ vẫn ổn, miễn thứ bạn cần là dung lượng chứ không phải tốc độ.

Quảng cáo


Ngoài MRDIMM và CXL 2.0 ra, mô hình trao đổi dữ liệu trên Granite Rapids cũng là yếu tố đáng cân nhắc. Vì đây không thuần tuý là 1 con chip thống nhất mà nó được "ghép" lại từ 1-3 die compute khác nhau. Mà mỗi die hoàn toàn "có tư cách" làm 1 CPU riêng (gồm cả nhân x86 lẫn IMC). Trong khi bên EPYC các nhân x86 cần phải thông qua die I/O để lấy dữ liệu từ RAM thì mỗi die Granite Rapids hoàn toàn chủ động việc này. Die compute nào cũng có 4 kênh DDR5 của riêng mình.

Intel Xeon 6 Cluster Mode.jpg
Xeon 6900P hoạt động tối ưu nhất ở chế độ Cluster

Từ đây nảy sinh vấn đề nếu 1 nhân x86 ở die A cần dữ liệu từ cache hay RAM ở die B hoặc C thì nó sẽ mất nhiều thời gian hơn so với lấy "tại nhà". Do vậy để đảm bảo tối ưu nhất về tốc độ trao đổi dữ liệu, Intel có 2 mô hình truy cập bộ nhớ gồm HEX và SNC3 (mặc định). Trong đó ở mô hình HEX, tất cả 3 die compute được xem như 1 thể thống nhất và không phân biệt dữ liệu được lấy từ đâu. Còn với mô hình SNC3 (sẵn trong BIOS), con chip được xem là 3 cụm (cluster) xử lý riêng biệt và mỗi cụm sẽ ưu tiên lấy dữ liệu từ die của mình trước khi "alo hỏi thăm" die lân cận.

Kiến trúc và hiệu năng


Khi Granite Rapids vừa ra mắt và bị Turin hạ bệ chỉ vài tuần sau đó, nhiều người đã chê bai Intel. Song trong quan điểm của mình, sự thua cuộc này là điều hoàn toàn có thể đoán trước được. Nếu Granite Rapids không thua Turin thì đó mới là chuyện thực sự đáng ngại cho AMD. Tại sao?

Intel Redwood Cove arch.jpg
Granite Rapids sử dụng kiến trúc Redwood Cove cùng loại với Meteor Lake

Granite Rapids không được xây dựng trên kiến trúc P-core mới nhất của Intel mà là phiên bản cũ hơn, Redwood Cove. Đây là kiến trúc dùng trên chip Meteor Lake ra mắt cuối năm ngoái của công ty này. Lunar Lake lẫn Arrow Lake vừa ra mắt gần đây dùng kiến trúc mới hơn là Lion Cove. Giữa 2 kiến trúc này có nhiều khác biệt nhưng điểm cơ bản nhất là Redwood Cove chỉ có 6-wide decoder, còn Lion Cove là 8-wide decoder. Kiến trúc Zen 5/5c vừa ra mắt của AMD cũng là 8-wide decoder nên có thể nói Lion Cove mới "ngang trình" Zen 5. Còn Redwood Cove nói suông là... "dưới trình".

Phân tích kỹ thuật nhân CPU trên Intel Meteor Lake - Không dành cho Windows 10?

Dù Meteor Lake (MTL) là một chip đa thành phần (SoC), thì sức mạnh CPU vẫn là "linh hồn" của một hệ thống PC. Ở bài viết này, chúng ta sẽ phân tích sâu hơn kiến trúc P-Core Redwood Cove và E-Core Crestmont nằm trên con chip mới nhất của Intel…
tinhte.vn


amd-Zen-5-Arch-04.jpg
Kiến trúc Zen 5 trên Turin thực sự mạnh hơn Redwood Cove rất nhiều

Bởi vậy Granite Rapids thua Turin là chuyện hiển nhiên. Còn không thua thì AMD mới là người phải... hết hồn! Và nhìn chung dù không công khai nói ra nhưng cả Lisa Su lẫn Pat Gelsinger đều hiểu rõ cuộc chơi hơn ai hết. Để có thể thắng Turin, ít nhất lứa Rapids thế hệ sau phải dựa trên Lion Cove. Nhưng cho tới nay, cả AMD và Intel cùng hết sức kín tiếng về dòng server tiếp theo của mình. Thứ duy nhất chúng ta "hóng" được tới lúc này là Intel đã có chip Panther Lake, với nhân P-core Cougar Cove. Còn cụ thể là gì thì tất cả đều là ẩn số.

Quay lại Granite Rapids, dù hiệu năng thua kém Turin, nhưng nó vẫn làm được một điều quan trọng nhất là mạnh hơn Genoa (EPYC 9004). Có thể nói với kiến trúc 6-wide decoder, lãnh đạo Intel hoàn toàn không mong đợi Granite Rapids sẽ so găng được với Turin. Nhưng vấn đề trước hết là công ty này vẫn cần khẳng định sự tồn tại trên mặt trận server, vì đấy là nơi mà Intel đã "đạp đổ" những tượng đài khác như Sun hay IBM. Granite Rapids nhìn theo một cách khác, cũng tương tự Meteor Lake ra đời trước đó - dù không trội hơn đối thủ nhưng là bước ngoặt để "tìm lại đường về" cho chính mình...

Nhận định


Những năm vừa qua là giai đoạn "phía sau đỉnh đồi" trong đồ thị hàm số Intel. Liệu công ty này đã "chạm đáy cực tiểu" trong 2024 này chưa thì chưa thể nói rõ. Tuy vậy không thể phủ nhận là nhà khổng lồ x86 dưới triều đại Pat Gelsinger đang liên tục thay đổi để "tìm lại chính mình".

Sapphire Rapids and Ponte Vecchio copy.jpg
Sapphire Rapids và Ponte Vecchio là 2 thứ kéo Intel thụt lùi

Giai đoạn 2022 trở về "kỷ nguyên" 14 nm là lúc Intel gần như không có sản phẩm gì nổi trội. Sapphire Rapids do Raja Koduri phát triển đúng nghĩa là quả bomb "xịt" khi được công bố hồi 2019 nhưng phải tới tận 2023 mới xuất hiện. Emerald Rapids ra mắt ngay sau đó gần như chỉ để "vá víu" những sai lầm mà Sapphire Rapids để lại. Nhìn một kiểu tương quan thì Sapphire Rapids hệt như Bulldozer mà AMD từng chạm phải. Đối thủ của Intel cũng đã phải hết sức chật vật để gỡ gạc lần lượt với Piledriver, Steamroller rồi chung cuộc là Excavator trước khi hồi sinh bằng Zen.

Và tới nay chúng ta có Granite Rapids. Tuy nhanh chóng bị Turin "phế truất" song dùng từ "thất bại" với con chip này thì không chính xác. Thứ có thể xem là điểm yếu lớn nhất của Granite Rapids lúc này chính là giá thành. Intel cần một chiến lược giá hợp lý hơn để tìm lại được sự cạnh tranh trước các đối thủ. Khách quan mà nói hầu như không ai quan tâm anh sản xuất con chip hết bao tiền, mà khách hàng chỉ quan tâm số tiền họ phải bỏ ra. Ví như AmpereOne chẳng hạn. Và so với các yếu tố khác (kiến trúc, hiệu năng, lỗi), giá thành vẫn là thứ dễ "khắc phục" nhất.

Intel-Xeon-6980P-Development-Platform-2.jpg
Điểm yếu nhất của Granite Rapids là giá thành quá cao

Đây cũng là lý do căn bản tại sao người dùng cần có sự cạnh tranh. Vì vả chăng nếu hoặc Intel hoặc AMD mất đi, thiệt thòi nhất vẫn là khách hàng. Thực tế chúng ta đã "trải nghiệm" điều này lúc AMD gần như phá sản, con chip desktop "xịn xò" nhất hành tinh chỉ có 4 nhân và nó kéo dài liên tục nhiều năm liền cho tới khi Ryzen xuất hiện. Ở mảng khác, NVIDIA gần như thành "độc tôn" khi AMD không còn mặn mà sản xuất GPU cao cấp nữa cho gamer. Ai là người thiệt thòi nhất, tự túi tiền bạn hiểu rõ.

Phân tích kỹ thuật vi xử lý máy chủ Intel Xeon 6900P - Phần 1

Khóa học Machine Learning cơ bản- Khoa học dữ liệu - AI
==***==

Khoá học Quản trị Chiến lược Dành cho Lãnh đạo Doanh nghiệp

Nhấn vào đây để bắt đầu khóa học

==***==
Nơi hội tụ Tinh Hoa Tri Thức - Khơi nguồn Sáng tạo
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com
--- 

Khóa học Hacker và Marketing từ A-Z trên ZALO!

Khóa học Hacker và Marketing từ A-Z trên Facebook!

Khóa đào tạo Power BI phân tích báo cáo để bán hàng thành công

Bảo mật và tấn công Website - Hacker mũ trắng
Hacker mũ trắng
KHÓA HỌC LẬP TRÌNH PYTHON TỪ CƠ BẢN ĐẾN CHUYÊN NGHIỆP

Khóa học Lập trình Visual Foxpro 9 - Dành cho nhà quản lý và kế toán

Khóa học hướng dẫn về Moodle chuyên nghiệp và hay
Xây dựng hệ thống đào tạo trực tuyến chuyên nghiệp tốt nhất hiện nay.



Khóa học AutoIt dành cho dân IT và Marketing chuyên nghiệp

Khoá học Word từ cơ bản tới nâng cao, học nhanh, hiểu sâu


Khóa học hướng dẫn sử dụng Powerpoint từ đơn giản đến phức tạp HIỆU QUẢ
Khóa học Thiết kế, quản lý dữ liệu dự án chuyên nghiệp cho doanh nghiệp bằng Bizagi
Khoa hoc hay
Khóa học Phân tích dữ liệu sử dụng Power Query trong Excel

Khóa học Lập trình WEB bằng PHP từ cơ bản đến nâng cao

Khóa học Phân tích dữ liệu sử dụng TableAU - Chìa khóa thành công!
Nhấn vào đây để bắt đầu khóa học


Khóa học Phân tích dữ liệu sử dụng SPSS - Chìa khóa thành công!


Khóa học "Thiết kế bài giảng điện tử", Video, hoạt hình 
kiếm tiền Youtube bằng phần mềm Camtasia Studio
Khóa học HƯỚNG DẪN THIẾT KẾ VIDEO CLIP CHO DÂN MARKETING CHUYÊN NGHIỆP
Xây dựng website​​​​
HƯỚNG DẪN THIẾT KẾ QUẢNG CÁO VÀ ĐỒ HỌA CHUYÊN NGHIỆP VỚI CANVA
Hãy tham gia khóa học để trở thành người chuyên nghiệp. Tuyệt HAY!😲👍
Khoa hoc hay
MICROSOFT ACCESS



GOOGLE SPREADSHEETS phê không tưởng
Khoa hoc hay
Khóa hoc lập trình bằng Python tại đây

Hãy tham gia khóa học để biết mọi thứ

Để tham gia tất cả các bài học, Bạn nhấn vào đây 

Khóa học lập trình cho bé MSWLogo
Nhấn vào đây để bắt đầu học
Nhấn vào đây để bắt đầu học


Khóa học Ba, Mẹ và Bé - Cùng bé lập trình  TUYỆT VỜI

Khoa hoc hay

Khóa học sử dụng Adobe Presenter-Tạo bài giảng điện tử
Khoa hoc hay
Design Website

Để thành thạo Wordpress bạn hãy tham gia khóa học 
Khóa học sử dụng Edmodo để dạy và học hiện đại để thành công
==***==
Bảo hiểm nhân thọ - Bảo vệ người trụ cột
Cập nhật công nghệ từ Youtube tại link: congnghe.hocviendaotao.com
Tham gia nhóm Facebook
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com

Nguồn: Tinh Tế