Header ads

Header ads
» »

Tìm hiểu công nghệ AMD 3D V-Cache - Phần 2: X3D và game?

Ở phần trước, mình đã nói sơ qua về cache và tầm quan trọng của nó đối với CPU, phần này chúng ta đi coi lý do vì sao 3D V-Cache lại nổi bật nhất khi xét về khía cạnh chơi game (không phải 100% nhưng là phần lớn).

Tại sao X3D thể hiện tốt nhất với game?


Trước đó mình đã nêu, thực tế mọi ứng dụng (trừ số ít hãn hữu) đều có thể khai thác được lợi ích từ một bộ cache to bự. Thực tế chính AMD cũng có phiên bản "full" X3D dành cho server (Genoa-X) và chả ai mua chip server để chơi game cả 😃 Nhưng game lại là nơi X3D toả sáng nhất, tại sao?

Trước hết cần làm rõ một "quan điểm": game mà chúng ta bàn tới là game 3D, nơi hệ số FPS thống trị tất cả. Vẫn có những game không phải 3D (đánh cờ chẳng hạn) nhưng hãy gác chúng qua bên, game của ngày hôm nay là game 3D. Và thứ mà mọi gamer mong chờ nhất sau khi cài xong 1 game 3D là gì? Hình ảnh trước hết phải mượt, tối thiểu cũng phải 30 fps, hoặc hơn thì 60 fps, cao nữa 120 hay 144 fps blah blah blah...

Tất nhiên phần lớn năng lực này do GPU quyết định (render đồ hoạ), nhưng CPU vẫn đóng phần quan trọng trong tính toán đối tượng, chủ thể, AI, NPC, event, vật lý (không bàn PhysX)... Lượng NPC càng đông thì CPU càng cần phải khoẻ, số tương tác đối tượng càng nhiều CPU cũng phải đảm nhận. Ở đây mình xài tạm Starfield, một game có yếu tố trọng lực cũng như nhiều thể loại đối tượng tương tác.

Starfield 1.jpg
Starfield 2.jpg
Starfield 3.jpg
Những vật thể lơ lửng trong Starfield. Hãy chú ý người chơi có thể tác động lên tất cả và CPU sẽ phải đảm nhiệm việc này. Những dữ liệu phát sinh ra sẽ được truy cập nhanh hơn nếu bộ cache lớn hơn

Như bạn cũng đã biết, độ "thật" của game tỷ lệ thuận với số vật thể, hiệu ứng mà gamer có thể tác động đến. Số tương tác càng nhiều nghĩa là số meta data phái sinh sẽ càng nhiều, mà điểm chính yếu ở chỗ các meta data này không có sẵn, chúng do gamer hoặc event tạo ra. Ở môi trường trọng lực bình thường mọi vật thể sẽ "nằm dưới", nhưng sang zero-G, tất cả đều lơ lửng và Starfield cho phép bạn "va chạm" với tất cả. Từ đó dẫn tới có những vật thể bình thường đang ở khoang A nhưng vì tác động của gamer, chúng trôi nổi qua khoang B và khi trọng lực có lại thì chúng không còn ở vị trí cũ. Đấy là meta data do chính gamer làm ra.

Và ai giải quyết tất cả những vấn đề đó? CPU. Nếu CPU không đủ mạnh để xử lý kịp các event thì sao? Nó sẽ gửi thông tin chậm tới GPU. Tới lượt GPU nhận tin chậm thì nó sẽ render chậm và trong vài trường hợp hãn hữu, hình ảnh render ra có thể không đúng với kết quả real time (ví dụ bạn bắn nổ bình xăng làm cháy địch nhưng GPU chưa nhận được thông tin cần render địch bị cháy).

Dĩ nhiên trong một hệ thống sẽ luôn có 1 thành phần "nghẽn cổ chai". Thường khi render ở độ phân giải thấp, game sẽ "nghẽn" ở CPU còn khi xuất hình ảnh ở độ phân giải cao, yêu cầu bóng đổ, ray-tracing, blurring, slo-mo... thì GPU mới "nghẽn". Do đó khi nói CPU tốt nhất cho game thì bạn nên hiểu rằng đây là CPU giúp xử lý các vấn đề không-phải-đồ-hoạ tốt nhất, chứ không phải chạy GPU cùi bắp mà đòi hình ảnh 4K @ 120 fps được.

Ryzen 7 9800X3D average-fps-1280-720.png
Ryzen 7 9800X3D average-fps-3840-2160.png
Ở độ phân giải thấp, chênh lệch fps cao nhất vs. thấp nhất tới 60%. Nhưng tăng độ phân giải thì gánh nặng chuyển dần sang GPU

Ngoài ra cần nói thêm một vấn đề nữa về game đó là đối tượng khách hàng. Tuy cũng là ứng dụng như bao ứng dụng khác, song game có 1 đặc thù là người dùng liên tục tiếp xúc và tương tác (ra lệnh) cho nó/CPU. Đặc trưng này khác hoàn toàn việc bạn ngồi render bản vẽ CAD hay encode phim hay giải nén RAR/ZIP. Thông thường với các ứng dụng trên, bạn cứ vứt chúng nó ở đấy rồi đi uống café hay làm việc khác. Nên thực tế việc render ở mấy fps với bạn cũng không có ý nghĩa, nhưng với game, "không mượt là không mượt".

Quảng cáo



Vì đặc thù khác biệt đó, mặc dù chơi GTA hay giải nén RAR cũng đều là công việc như nhau, nhưng cái trải nghiệm người dùng (UX) khi phóng xe trên xa lộ và bị truy nã 5 sao sẽ có ấn tượng nhiều hơn. Vì chính bạn là người "cảm nhận" được cái sự mượt mà đó. Chứ không phải vừa làm việc, vừa xem live stream, vừa thả tim ai đó trên mạng xã hội...

sram-density-tsmc-n3be.webp
X3D không chỉ lợi cho game. Các ứng dụng nặng về data vẫn được hưởng lợi từ một bộ cache lớn. Vấn đề là trải nghiệm "chơi game mượt mà" rất khó thấy khi chúng ta làm việc

Đến đây, hẳn bạn cũng hiểu tại sao cache càng to càng có lợi (không phải 100% nhưng phần lớn là thế). Tiếp theo, mặc dù lý thuyết cache bự ai cũng biết, nhưng làm sao để ra sản phẩm thực tế là cả vấn đề. Có thể nói bất kỳ công ty sản xuất chip nào cũng hiểu những vấn đề này, nhưng làm sao để triển khai nó trong thực tiễn thì lại là vấn đề khác. Một câu quen thuộc hầu như ai cũng từng nghe qua là "nói thì dễ hơn làm".

Mình cũng đã từng nêu, cấu trúc SRAM không có gì quá phức tạp vì hàng chục năm qua nó vẫn vậy. Vấn đề lớn nhất ở đây là SRAM tốn rất nhiều transistor (T) để làm ra. Loại SRAM phổ thông hiện tại cần tới 6T chỉ để chứa 1 bit dữ liệu! Để tiện so sánh, bộ nhớ DRAM chỉ tốn 1T và 1 tụ điện để chứa 1 bit dữ liệu. Tất nhiên chúng ta vẫn có những kiểu SRAM tốn ít hoặc nhiều transistor hơn 6T, nhưng vì chúng ít được xài hơn nên tạm không truy xét.

Cơn "hấp hối" của SRAM


Hao tổn transistor/silicon chỉ là 1 mặt của vấn đề, một vấn đề khác "nghiêm trọng" hơn là trong những năm trở lại đây, việc thu nhỏ tế bào SRAM đã khó khăn hơn trước rất nhiều. Nếu các mạch logic (CPU, GPU, DSP...) thu nhỏ tương đối tốt sau mỗi tiến trình bán dẫn thì bộ nhớ nói chung lại không được như vậy. Có một thực tế là không chỉ SRAM mà cả DRAM hay NAND cũng không tăng mật độ dữ liệu hơn trước là bao. Nếu để ý, bạn sẽ thấy các tiến trình sản xuất DRAM/NAND tiên tiến nhất hiện nay vẫn đâu đó ở 10 nm hoặc lớn hơn.

Quảng cáo



[​IMG]
So sánh kích thước SRAM của các hãng theo từng năm (TSMC màu cam). Có thể thấy mặc dù có nhỏ đi thật nhưng chênh lệch này cứ giảm dần. Riêng TSMC N3P bự ngang TSMC N5!

Tại hội nghị IEDM 2022, TSMC đã khiến cả giới bán dẫn nhảy dựng lên khi công bố kích thước tế bào SRAM của tiến trình N3. Cụ thể trong khi mật độ mạch logic N3 cao gấp 1.6 lần mạch N5, thì mật độ SRAM chỉ "nhích" lên 5% (33.55 so với 31.8 Mb/mm^2)! Tệ hơn, phiên bản N3E (nâng cấp của N3) có mật độ SRAM bằng đúng N5 (31.8 Mb/mm^2). Có nghĩa 32 MB SRAM ở N5 có kích thước bao nhiêu thì sang N3E không có gì thay đổi!

May thay trong thông tin mới đây nhất về tiến trình N2 (sẽ đi vào sản xuất trong nửa cuối 2025), TSMC cho biết mật độ SRAM của N2 sẽ tăng lên đáng kể, ở mức 38 Mb/mm^2. Tuy vậy, khả năng này đạt được nhờ N2 đã chuyển sang cấu trúc GAAFET nhỏ gọn hơn FinFET. Nhưng GAAFET không phải lá bài vĩnh cửu. Thực tế là khả năng thu nhỏ transistor đang càng lúc càng khó hơn. Thế nên trong một tương lai xa hơn thì việc mật độ SRAM "dậm chân tại chỗ" vẫn luôn ám ảnh các công ty thiết kế chip.

n16-n5-n3-scaling-chip.webp
Một thiết kế chip giả định 10 tỷ transistor dựa trên 3 tiến trình N6, N5 và N3. Có thể thấy phần SRAM chiếm ngày càng nhiều hơn sau mỗi tiến trình

Tất nhiên TSMC không phải công ty duy nhất có thể sản xuất chip bán dẫn. Song với việc Intel lẫn Samsung đang "hì hục" theo sau công ty Đài Loan thì đây là một viễn cảnh khá u ám cho giới công nghệ. Hiện tượng này có nghĩa là nếu muốn tăng thêm số nhân xử lý (mạch logic) cho các con chip tương lai, các công ty thiết kế chip phải cân nhắc liệu có phải tăng kích thước die chip (để giữ nguyên dung lượng cache/nhân) hoặc giảm bớt dung lượng cache/nhân (để giữ die chip không phình ra). Đau đầu lắm đấy!

Đây cũng là lý do tại sao dù con chip bự nhất hành tinh WSE-3 của Cerebras mặc dù có tới 4000 tỷ transistor N5 nhưng số nhân và SRAM của nó tăng không bao nhiêu so với phiên bản WSE-2 ra mắt trước đó chỉ có 2600 tỷ transistor N7 (900,000 vs. 850,000 nhân và 44 vs. 40 GB SRAM), vì phần lớn số transistor có thêm này chủ yếu để "đắp" vào SRAM.

AMD 3D V-Cache 12.jpg
Kích thước cache trở thành mối lo âu của nhiều công ty chip như AMD

Chia hộ khẩu để tốt hơn


Từ vấn đề thu nhỏ SRAM nêu trên, các kỹ sư bán dẫn bắt đầu suy nghĩ những phương pháp khác nhau để cải thiện tình hình. Một trong các cách đó là thiết kế nhiều die (MCM hoặc chiplet). Trên thực tế thì hướng đi này không hề mới, những con chip như POWER7 của IBM hay PlayStation 2 của Sony hay Haswell của Intel đều kèm theo một (số) die chip nhớ bên cạnh die CPU. Khác biệt ở đây chúng không phải SRAM mà là DRAM (hay eDRAM).

Nhưng nhắc lại các ví dụ trên không phải để nói AMD cũng làm y chang họ, mà ở mặt ý tưởng - SRAM hoàn toàn có thể không nằm cùng die với CPU.

AMD 3D V-Cache 02.jpg
AMD 3D V-Cache "đời đầu" với die X3D nằm trên die CCD

Như đã nêu ở trên, mạch SRAM và mạch logic bắt đầu xuất hiện sự chia rẽ. Sự bất đồng về hệ số thu nhỏ kích thước này dẫn tới việc SRAM ngày càng chiếm nhiều diện tích hơn, mà xu hướng này cứ kéo dài thì tới một lúc phần lớn "đất" làm chip sẽ chỉ toàn SRAM. Hay nói cách khác là hiệu năng chip đời sau sẽ tăng nhỏ giọt vì các công ty không thể nhồi nhét được nhiều nhân xử lý hơn mức quota silicon còn lại được.

Vậy là SRAM phải "ra đi". Hay đúng hơn là "một phần" (không thể bỏ toàn bộ SRAM ra khỏi mạch logic được) SRAM sẽ không cùng die với CPU nữa.

Từ đây xuất hiện một cách nghĩ khác về SRAM - chúng có thể được sản xuất trên tiến trình cũ hơn nếu như việc thay đổi node bán dẫn không có lợi (với SRAM). Vì tiến trình cũ thường có hiệu suất tốt hơn mà giá thành cũng rẻ hơn các tiến trình mới. Như thế, giá thành chung sẽ thấp hơn so với việc dồn hết SRAM và mạch logic vô cùng một die chip (dùng tiến trình mới nhất).

Nhưng "cắt khẩu" thôi chưa đủ. Vì vấn đề đơn giản như thế thì các công ty khác cũng đã áp dụng với SRAM chứ không phải chỉ dừng lại ở DRAM. Tại sao?

Skylake-R eDRAM.jpg
Có thêm eDRAM cũng tốt, nhưng không đủ tốt về độ trễ khi là thiết kế chiplet 2D

Vấn đề ở khoảng cách. Hãy nhớ ví dụ nhà máy ở phần trước. Nếu DRAM như một cái kho nằm ở cảng vụ cách hàng km thì SRAM là đống pallet chỉ cách xưởng sản xuất có vài mét/vài chục mét. Nếu SRAM cũng nằm ở 1 die riêng rẽ như eDRAM thì lợi ích trở nên nhạt nhoà - mạch điện quá dài dẫn tới độ trễ quá cao. Nói cách khác, kể cả có khác die thì yêu cầu vẫn phải là độ trễ cực thấp - 2 die mà phải như 1 die! Làm thế nào???

Tìm hiểu công nghệ AMD 3D V-Cache - Phần 1: Cache để làm gì?

Tìm hiểu công nghệ AMD 3D V-Cache - Phần 3: Từ cấp 4 lên nhà cao tầng

Khóa học Machine Learning cơ bản- Khoa học dữ liệu - AI
==***==

Khoá học Quản trị Chiến lược Dành cho Lãnh đạo Doanh nghiệp

Nhấn vào đây để bắt đầu khóa học

==***==
Nơi hội tụ Tinh Hoa Tri Thức - Khơi nguồn Sáng tạo
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com
--- 

Khóa học Hacker và Marketing từ A-Z trên ZALO!

Khóa học Hacker và Marketing từ A-Z trên Facebook!

Khóa đào tạo Power BI phân tích báo cáo để bán hàng thành công

Bảo mật và tấn công Website - Hacker mũ trắng
Hacker mũ trắng
KHÓA HỌC LẬP TRÌNH PYTHON TỪ CƠ BẢN ĐẾN CHUYÊN NGHIỆP

Khóa học Lập trình Visual Foxpro 9 - Dành cho nhà quản lý và kế toán

Khóa học hướng dẫn về Moodle chuyên nghiệp và hay
Xây dựng hệ thống đào tạo trực tuyến chuyên nghiệp tốt nhất hiện nay.



Khóa học AutoIt dành cho dân IT và Marketing chuyên nghiệp

Khoá học Word từ cơ bản tới nâng cao, học nhanh, hiểu sâu


Khóa học hướng dẫn sử dụng Powerpoint từ đơn giản đến phức tạp HIỆU QUẢ
Khóa học Thiết kế, quản lý dữ liệu dự án chuyên nghiệp cho doanh nghiệp bằng Bizagi
Khoa hoc hay
Khóa học Phân tích dữ liệu sử dụng Power Query trong Excel

Khóa học Lập trình WEB bằng PHP từ cơ bản đến nâng cao

Khóa học Phân tích dữ liệu sử dụng TableAU - Chìa khóa thành công!
Nhấn vào đây để bắt đầu khóa học


Khóa học Phân tích dữ liệu sử dụng SPSS - Chìa khóa thành công!


Khóa học "Thiết kế bài giảng điện tử", Video, hoạt hình 
kiếm tiền Youtube bằng phần mềm Camtasia Studio
Khóa học HƯỚNG DẪN THIẾT KẾ VIDEO CLIP CHO DÂN MARKETING CHUYÊN NGHIỆP
Xây dựng website​​​​
HƯỚNG DẪN THIẾT KẾ QUẢNG CÁO VÀ ĐỒ HỌA CHUYÊN NGHIỆP VỚI CANVA
Hãy tham gia khóa học để trở thành người chuyên nghiệp. Tuyệt HAY!😲👍
Khoa hoc hay
MICROSOFT ACCESS



GOOGLE SPREADSHEETS phê không tưởng
Khoa hoc hay
Khóa hoc lập trình bằng Python tại đây

Hãy tham gia khóa học để biết mọi thứ

Để tham gia tất cả các bài học, Bạn nhấn vào đây 

Khóa học lập trình cho bé MSWLogo
Nhấn vào đây để bắt đầu học
Nhấn vào đây để bắt đầu học


Khóa học Ba, Mẹ và Bé - Cùng bé lập trình  TUYỆT VỜI

Khoa hoc hay

Khóa học sử dụng Adobe Presenter-Tạo bài giảng điện tử
Khoa hoc hay
Design Website

Để thành thạo Wordpress bạn hãy tham gia khóa học 
Khóa học sử dụng Edmodo để dạy và học hiện đại để thành công
==***==
Bảo hiểm nhân thọ - Bảo vệ người trụ cột
Cập nhật công nghệ từ Youtube tại link: congnghe.hocviendaotao.com
Tham gia nhóm Facebook
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com

Nguồn: Tinh Tế

About Học viện đào tạo trực tuyến

Xinh chào bạn. Tôi là Đinh Anh Tuấn - Thạc sĩ CNTT. Email: dinhanhtuan68@gmail.com .
- Nhận đào tạo trực tuyến lập trình dành cho nhà quản lý, kế toán bằng Foxpro, Access 2010, Excel, Macro Excel, Macro Word, chứng chỉ MOS cao cấp, IC3, tiếng anh, phần mềm, phần cứng .
- Nhận thiết kế phần mềm quản lý, Web, Web ứng dụng, quản lý, bán hàng,... Nhận Thiết kế bài giảng điện tử, số hóa tài liệu...
HỌC VIỆN ĐÀO TẠO TRỰC TUYẾN:TẬN TÂM-CHẤT LƯỢNG.
«
Next
Bài đăng Mới hơn
»
Previous
Bài đăng Cũ hơn