Bài viết chia sẻ một số thông tin thú vị liên quan đến bit, byte, sự khác biệt giữa hai thuật ngữ gigabit (Gb) và gigabyte (GB) cũng như một số lưu ý trong cách tính dung lượng ổ cứng và tốc độ truyền tải dữ liệu để bạn đọc có thêm thông tin tham khảo.
Như chúng ta đã biết, bit - viết tắt của binary digital, là đơn vị nhỏ nhất dùng để biểu diễn thông tin trong máy tính. Mỗi bit là một chữ số nhị phân 0 hoặc 1 thể hiện một trong hai trạng thái tắt hoặc mở tương ứng của cổng luận lý trong mạch điện tử. Cũng cần nói thêm là hệ nhị phân đã trở thành một phần kiến tạo căn bản trong máy tính ngày nay và ngôn ngữ giao tiếp cấp thấp vẫn sử dụng hệ đếm cơ số hai này.
Thuật ngữ byte dùng để mô tả một dãy số bit cố định, do Werner Buchholz đưa ra trong thời gian đầu thiết kế hệ thống IBM 7030. Một byte có 8 bit, biểu thị được 256 giá trị khác nhau (2^8 = 256) đủ để lưu trữ một số nguyên không dấu từ 0 đến 255 hoặc số có dấu từ -128 đến 127. Tuy nhiên vào thời gian đầu, một số máy tính cũ hơn như IBM 1401 chỉ dùng 6 bit trong một byte cho đến cuối năm 1956, quy chuẩn về byte 8 bit mới được thiết lập.
Byte thường được viết tắt là "B" trong khi ''b'' là ký hiệu của bit và 8 bit ghép thành 1 byte.
Tương tự các đơn vị lớn hơn byte phổ biến trong hệ nhị phân gồm:
- 1 kilobit (Kb) = 2^10 bit hay 1.024 bit.
- 1 megabit (Mb) = 2^20 bit hay 1.048.576 bit.
- 1 gigabit (Gb) = 2^30 bit hay 1.073.741.824 bit.
Những thông tin cơ bản trên chỉ mang tính tham khảo vì trên thực tế chúng ta thường dùng gigabyte và terabyte để chỉ dung lượng ổ cứng và khả năng lưu trữ, Ngoài ra còn có terabyte, petabyte, exabyte, zettabyte, yottabyte và brontobyte.
- 1 kilobyte (KB) = 2^10 byte hay 1.024 byte.
- 1 megabyte (MB) = 2^20 byte hay 1.048.576 byte.
- 1 gigabyte (GB) = 2^30 byte hay 1.073.741.824 byte.
Dung lượng ổ cứng
![]()
Ổ cứng máy tính ngày càng rẻ và có dung lượng lưu trữ cao hơn. Ổ cứng 500GB được xếp vào mức cơ bản và cao nhất hiện nay là 6TB với giá vào khoảng 6,6 đến 6,9 triệu đồng. Tuy nhiên khi sử dụng thực tế, bạn sẽ phát hiện rằng dung lượng ổ cứng không đủ 500GB như thông tin nhà sản xuất công bố. Hơn nữa khi so sánh dung lượng phân vùng ổ cứng đã sử dụng và tổng dung lượng tất cả thư mục, tập tin lưu trữ cũng không bằng nhau. Vậy tại sao có sự chênh lệch này và dung lượng ổ cứng đã mất đi đâu ?
Về bản chất thì dung lượng ổ cứng không đổi và sự sai lệch nằm ở cách tính của nhà sản xuất và hệ điều hành. Cụ thể nhà sản xuất tính dung lượng ổ cứng theo hệ thập phân, cụ thể 1MB = 10^6 byte hay 1.000.000 byte và 1GB = 10^9 byte. Trong khi đó máy tính và những phần mềm ứng dụng lại sử dụng hệ nhị phân như đã nêu trên.
Để tránh nhầm lẫn, một số tổ chức tiêu chuẩn như JEDEC, IEC và ISO đã đưa ra đề nghị sử dụng thuật ngữ thay thế là kibibyte (KiB), mebibyte (MiB), gibibyte (GiB), tebibyte (TiB) trong đo lường dữ liệu số máy tính theo hệ nhị phân.
Tốc độ truyền tải dữ liệu
Chuẩn giao tiếp SATA được giới thiệu lần đầu vào năm 2001 và hiện là chuẩn phổ biến dùng cho các thiết bị lưu trữ gắn trong như ổ cứng, SSD và ổ quang. SATA đã trải qua ba thế hệ với tốc độ truyền dẫn nhanh hơn, gồm SATA 1.0 có tốc độ 1,5 Gb/s (tương đương 150 MB/s), SATA 2.0 là 3 Gb/s (~ 300 MB/s) và SATA 3.0 có tốc độ truyền dữ liệu lên tới 6 Gb/s (~600 MB/s).
Nhiều bạn thắc mắc là nếu quy đổi từ Gb/s (gigabit/giây) sang MB/s thì tốc độ truyền dữ liệu của các chuẩn SATA tương ứng lần lượt là 192, 384 và 768 MB/s.
Vấn đề nằm ở phương thức truyền dữ liệu qua mạng. Chuẩn SATA dùng kỹ thuật mã hóa 8b/10b (là sự sắp mã theo byte, mỗi byte của dữ liệu vào 1 hay 2 ký tự 10 bit). Như vậy, thông tin truyền và nhận không chỉ có dữ liệu mà còn cả các thông tin điều khiển nhằm xác thực, đảm bảo tính toàn vẹn của dữ liệu khi gửi.
Tương tự giao tiếp PCI Express 1.0 và 2.0 cũng sử dụng phương thức mã hóa 8b/10b trong khi PCIe 3.0 áp dụng kỹ thuật "scrambling", dùng hàm nhị phân để biểu diễn luồng dữ liệu. Chính nhờ vậy mà chuẩn PCI Express 3.0 tăng gấp đôi hiệu năng so với thế hệ 2.0 nhưng chỉ cần tốc độ bit là 8 GT/s thay vì phải cần đến 10 GT/s.