Mục lục
RAID là gì?
RAID là chữ viết tắt (Redundant Arrays of Inexpensive Disks hoặc Redundant Arrays of Independent Disks). Ban đầu, RAID được sử dụng như một giải pháp phòng hộ vì nó cho phép ghi dữ liệu lên nhiều đĩa cứng cùng lúc. Về sau, RAID đã có nhiều biến thể cho phép không chỉ đảm bảo an toàn dữ liệu mà còn giúp gia tăng đáng kể tốc độ truy xuất dữ liệu từ đĩa cứng.
– RAID chỉ nên làm việc với các loại ổ cứng có dung lượng bằng nhau.
– Sử dụng RAID sẽ tốn số lượng ổ cứng nhiều hơn bình thường, nhưng đổi lại là dữ liệu sẽ an toàn hơn.
– RAID có thể dùng cho bất kỳ hệ điều hành nào từ Window 98, window 2000, window XP, Window 10, Window 11, window server 2016, window server 2019, MAC OS X, Linux…vv
Lịch sử phát triển
Lần đầu tiên RAID được phát triển năm 1987 tại trường Đại học California tại Berkeley (Hoa Kỳ) với những đặc điểm chỉ ghép các phần đĩa cứng nhỏ hơn thông qua phần mềm để tạo ra một hệ thống đĩa dung lượng lớn hơn thay thế cho các ổ cứng dung lượng lớn giá đắt thời bấy giờ.
Mặc dù hiện nay không tồn tại nữa, nhưng Hội đồng tư vấn phát triển RAID (RAID Advisory Board: Viết tắt là RAB) đã ra thành lập tháng 7 năm 1992 để định hướng, lập ra các tiêu chuẩn, định dạng cho RAID. RAB đã phân ra các loại cấp độ RAID (level), các tiêu chuẩn phần cứng sử dụng RAID. RAB đã phân ra bảy loại cấp độ RAID từ cấp độ 0 đến cấp độ 6.
>>> Có thể bạn quan tậm: Tìm hiểu về công nghệ ổ cứng SSD NVMe
Phương thức lưu trữ cơ bản trong RAID
Hiện tại những phương thức chính để lưu trữ dữ liệu trong mảng gồm có:
- Phân chia dải (Striping): Tách luồng dữ liệu thành những khối với kích thước nhất định (kích thước khối) và sau đó viết mỗi khối này qua mỗi RAID. Cách thức để lưu trữ những dữ liệu này sẽ ảnh hưởng trực tiếp tới hiệu suất.
- Mirroring: Là 1 kỹ thuật lưu trữ và trong đó những bản sao dữ liệu mà giống hệt với nhau sẽ được lưu trữ trên những thành viên RAID cùng 1 lúc. Loại vị trí của dữ liệu này sẽ ảnh hưởng trực tiếp tới hiệu suất cũng như khả năng chịu lỗi.
- Parity: hiện tại là 1 kỹ thuật lưu trữ sử dụng những phương pháp tổng kiểm tra và phân loại. Trong kỹ thuật chẵn lẻ thì 1 hàm chẵn lẻ nhất định sẽ được tính cho những khối dữ liệu. Nếu như 1 ổ đĩa bị lỗi, thì khối bị thiếu sẽ được tính lại từ tổng kiểm tra và cung cấp về khả năng chịu lỗi RAID.
Phân loại RAID thường sử dụng
Theo RAB thì RAID được chia thành 7 cấp độ (level), mỗi cấp độ có các tính năng riêng, hầu hết chúng được xây dựng từ hai cấp độ cơ bản là RAID 0 và RAID 1.
1. RAID 0
Đây là dạng RAID đang được người dùng ưa thích do khả năng nâng cao hiệu suất trao đổi dữ liệu của đĩa cứng. RAID 0 cần sử dụng 2 ổ đĩa cứng tuy nhiên vẫn có thể sử dụng được 1 ổ, RAID 0 cho phép máy tính ghi dữ liệu lên chúng theo một phương thức đặc biệt được gọi là Striping. Dữ liệu sẽ được chia ra thành nhiều phần bằng nhau. Ví dụ có 2 ổ cứng 80GB thì hệ thống ổ đĩa sẽ là 160GB.
Ưu điểm: Tăng tốc độ đọc/ghi đĩa: mỗi đĩa chỉ cần phải đọc/ghi 1/n lượng dữ liệu được yêu cầu. Lý thuyết thì tốc độ sẽ tăng lên n lần.
Nhược điểm: Tính an toàn thấp. Nếu một đĩa bị hư thì dữ liệu trên tất cả các đĩa còn lại sẽ không còn sử dụng được. Xác suất để mất dữ liệu sẽ tăng n lần so với dùng ổ đĩa đơn.
RAID 0 thích hợp cho những người dùng cần truy cập nhanh khối lượng dữ liệu lớn, ví dụ các game thủ hoặc những người chuyên làm đồ hoạ, chỉnh sửa ảnh và video.
2. RAID 1
Đây là dạng RAID cơ bản nhất có khả năng đảm bảo an toàn dữ liệu. Cũng giống như RAID 0, RAID 1 đòi hỏi ít nhất hai đĩa cứng để làm việc. Dữ liệu được ghi vào 2 ổ giống hệt nhau theo kỹ thuật sao chép nhân bản (Mirroring). Trong trường hợp một ổ bị trục trặc, ổ còn lại sẽ tiếp tục hoạt động bình thường. Người dùng có thể thay thế ổ đĩa bị hỏng mà không phải lo lắng đến vấn đề thông tin bị mất.
Đối với RAID 1, hiệu năng không phải là yếu tố hàng đầu nên chẳng có gì ngạc nhiên nếu nó không phải là lựa chọn số một cho những người say mê tốc độ. Tuy nhiên đối với những nhà quản trị mạng hoặc những ai phải quản lý nhiều thông tin quan trọng thì hệ thống RAID 1 là thứ không thể thiếu. Dung lượng cuối cùng của hệ thống RAID 1 bằng dung lượng của ổ đơn (Ví dụ: hai ổ 80GB chạy RAID 1 sẽ cho hệ thống nhìn thấy duy nhất một ổ RAID 80GB)
Ưu điểm: có tốc độ đọc nhanh tương đương RAID 0, đặc biệt khi bộ điều khiển RAID được ghép kênh để đọc dữ liệu đồng thời từ nhiều đĩa. Dữ liệu được ghi đồng thời lên hai ổ đĩa luôn đảm bảo tính sẵn sàng cho hệ thống, khi 1 ổ đĩa hỏng, dữ liệu được truy xuất một cách toàn vẹn từ ổ còn lại. Hiệu suất hoạt động đảm bảo ngay cả hệ thống đang ghi
Nhược điểm: RAID 1 cần gấp đôi dung lượng nên gây tốn kém hơn.
3. RAID 0+1
Đây là cấp độ RAID được tổng hợp các ưu điểm của sự nhanh nhẹn từ RAID 0, và an toàn dữ liệu từ RAID 1. Cần tối thiểu 4 ổ đĩa cứng, tất cả dữ liệu sẽ được ghi đồng thời lên 4 đĩa cứng với 2 ổ dạng Stripping tăng tốc và 2 ổ dạng Mirroring sao lưu. Dung lượng cuối cùng sẽ bằng 1/2 tổng dung lượng 4 ổ đĩa (Ví dụ: 4 ổ đĩa 80GB thì dung lượng mà hệ thống thấy được bằng (80*4)/2=160GB).
4. RAID 5
RAID 5 là sự cải tiến của RAID 0, có cung cấp cơ chế khôi phục dữ liệu, sử dụng kỹ thuật hạn chế lỗi gọi là phân chia chẵn lẻ (Parity) dùng để khôi phục dữ liệu được phân bố đồng đều trên tất cả các ổ đĩa cứng. RAID 5 yêu cầu tối thiểu 3 ổ cứng. RAID 5 có thể bị lỗi một ổ cứng nhưng hệ thống vẫn hoạt động tuy nhiên việc truy xuất dữ liệu sẽ giảm đôi chút.
Giả sử dữ liệu A được phân tách thành 3 phần A1, A2, A3 (Xem hình RAID 5), khi đó dữ liệu được chia thành 3 phần chứa trên các ổ đĩa cứng 0, 1, 2 (giống như RAID 0). Phần ổ đĩa cứng thứ 3 chứa Parity (Ap) của A1 A2 A3 để khôi phục dữ liệu có thể sẽ mất ở ổ đĩa cứng 0, 1, 2.
Dữ liệu B được chia thành B1 B2 B3 và Parity của nó là Bp, theo thứ tự B1 B2 B3 được lưu trữ tại ổ 0 1 3, và Bp được lưu trữ tại ổ 2. Các Parity được lưu trữ tuần tự trên các ổ đĩa cứng. RAID 5 cho phép tối đa có 1 ổ cứng bị chết tại một thời điểm, nếu có nhiều hơn 1 ổ cứng bị chết tại một thời điểm thì toàn bộ dữ liệu coi như mất hết. RAID 5 cũng yêu cầu các ổ cứng tham gia RAID phải có dung lượng bằng nhau. Dung lượng đĩa cứng cuối cùng bằng tổng dung lượng đĩa sử dụng trừ đi một ổ. Tức là nếu bạn dùng 3 ổ 80GB thì dung lượng cuối cùng sẽ là 160GB.
Ưu điểm: Tốc độ đọc ghi dữ liệu rất nhanh. An toàn về dữ liệu, sử dụng kỹ thuật phân chia parity có thể khôi phục lại dữ liệu, tránh lưu trữ trùng lặp, không xảy ra downtime khi hệ thống có một ổ đĩa bị lỗi và cần khôi phục.
Nhược điểm: Đây là một công nghệ phức tạp, việc khôi phục dữ liệu sẽ mất nhiều thời gian.
5. RAID 6
Cũng giống như RAID 5, nhưng RAID 6 là giải pháp mạnh mẽ hơn bởi nó sử dụng đến hai khối parity (dữ liệu chẳn lẻ) và yêu cầu tối thiểu 4 ổ đĩa. Nếu hệ thống có 2 ổ đĩa chết cùng một lúc thì hệ thống vẫn có thể tiếp tục hoạt động. So với RAID 5 thì hiệu suất và tốc độ ghi của RAID 6 không bằng do phải tính toán nhiều khối parity phức tạp hơn, nhưng có tốc độ đọc ghi ngẫu nhiên nhanh hơn do dữ liệu được Stripping qua nhiều ỗ đĩa hơn.
Ưu điểm: Giống RAID 5 các chuyển đổi dữ liệu trên RAID 6 đọc rất nhanh, đảm bảo an toàn về dữ liệu.
Nhược điểm: Hiệu suất thấp hơn so với RAID 5, mất nhiều thời gian để rebuild khi có một ổ đĩa bị lỗi.
6. Một số loại RAID khác
Ngoài các loại RAID được đề cập ở trên, bạn còn có thể bắt gặp nhiều loại RAID khác nhưng chúng không được sử dụng rộng rãi mà chỉ giới hạn trong các hệ thống máy tính phục vụ mục đích riêng, có thể kể như: Level 2 (Error-Correcting Coding), Level 3 (Bit-Interleaved Parity), Level 4 (Dedicated Parity Drive), Level 6 (Independent Data Disks with Double Parity), Level 10 (Stripe of Mirrors, ngược lại với RAID 0+1), Level 7 (thương hiệu của tập đoàn Storage Computer, cho phép thêm bộ đệm cho RAID 3 và 4), RAID S (phát minh của tập đoàn EMC và được sử dụng trong các hệ thống lưu trữ Symmetrix của họ). Bên cạnh đó còn một số biến thể khác, ví dụ như Intel Matrix Storage cho phép chạy kiểu RAID 0+1 với chỉ 2 ổ cứng hoặc RAID 1.5 của DFI trên các hệ BMC 865, 875. Chúng tuy có nhiều điểm khác biệt nhưng đa phần đều là bản cải tiến của các phương thức RAID truyền thống.
Đối với RAID 10 dữ liệu sẽ được lưu đồng thời vào 4 ổ cứng, trong đó 2 ổ dạng Striping (RAID 0) và 2 ổ (Mirroring). Về bản chất thì RAID 10 là sự kết hợp giữa 2 loại RAID phổ biến và RAID 1 và RAID 0. Khi so sánh RAID 5 với RAID 10, chúng ta có thể thấy chúng đều giúp nâng cao hiệu suất, an toàn dữ liệu. Tuy nhiên, lưu trữ RAID 5 thì tiết kiệm chi phí hơn so với hình thức lưu trữ RAID 10.
Triển khai RAID
RAID có thể được tao ra bằng hai cách khác nhau:
- Sử dụng trình điều khiển hệ điều hành, được gọi là software RAID
- Sử dụng phần cứng đặc biệt, được gọi là hardware RAID.
RAID mềm
Phần mềm RAID là một trong những giải pháp RAID rẻ nhất. Ngày nay, hầu hết mọi hệ điều hành đều có khả năng tích hợp để tạo RAID, mặc dù không phải cho tất cả các cấp RAID. Do đó, phiên bản Windows Home cho phép người dùng chỉ tạo RAID 0, trong khi RAID 1 và RAID 5 chỉ có thể được tạo bằng phiên bản máy chủ Windows. Bố cục RAID được tạo bởi phương tiện của Windows được liên kết không thể tách rời với hệ điều hành máy chủ và do đó, phân vùng của nó không thể được sử dụng.
Hiện tại RAID phần mềm sẽ được tạo ra dựa vào máy tính người dùng. Do đó nó dùng CPU hệ thống của máy chủ để thực hiện. Tuy nhiên cần lưu ý rằng, đối với trường hợp RAID thuộc cấp 0, 1, thì tải CPU sẽ không đáng kể, tuy nhiên với những loại RAID dựa vào tính chẵn lẻ thì tải CPU hoàn toàn có thể thay đổi tùy thuộc vào sức mạnh của CPU từ 1 tới 5% và số lượng của đĩa và cũng không đáng kể gì cho những mục đích thực tế.
Khi dùng RAID phần mềm để tiến hành khởi động hệ thống sẽ có 1 số những hạn chế nhất định. Chỉ RAID 1 mới có thể chứa được phân vùng khởi động và không thể nào khởi động hệ thống cùng phần mềm RAID 0 cũng như RAID 5.
Vì vậy trong hầu hết những trường hợp thì phần mềm RAID sẽ không thực hiện việc trao hot swap, do đó không thể dùng phần mềm nếu cần tính liên tục.
RAID cứng
RAID phần cứng sẽ được tạo ra bằng phần cứng riêng biệt. Theo đó về cơ bản sẽ có 2 lựa chọn là:
– Chip RAID rẻ tiền hoàn toàn có thể được tích hợp trực tiếp vào trong bo mạch chủ.
– Với tùy chọn đắt tiền hơn có bộ điều khiển RAID phức tạp độc lập. Những bộ điều khiển như thế này hoàn toàn có thể trang bị CPU riêng, bộ nhớ đệm sao lưu bằng pin và thông thường sẽ hỗ trợ trao đổi nóng.
So với RAID phần mềm thì RAID phần cứng sẽ có 1 số những ưu điểm sau:
- Không dùng CPU của máy chủ
- Xử lý lỗi tốt hơn, do giao tiếp với những thiết bị trực tiếp
- Cho phép tất cả người dùng có thể tạo phân vùng khởi động
- Hỗ trợ trao đổi nóng.
Kết luận
RAID là một công nghệ đảm bảo an toàn cho dữ liệu, tuy nhiên RAID không thể thay thế hoàn toàn cho việc backup lại dữ liệu của người dùng.
Những cấp độ RAID trừ RAID 0 hiện tại đều có khả năng bảo vệ khỏi lỗi ổ đĩa. Thậm chí hệ thống RAID 6 còn sống sót ngay khi 2 ổ đĩa đồng thời chết. Nhưng để có thể bảo mật hoàn toàn thì bạn cũng cần phải backup dữ liệu đã được lưu trữ tại hệ thống RAID.
Liên hệ với Tadu
– Website: https://tadu.cloud/
– Tổng đài 24/7: 1800 6980 nhánh 1
– Email: lienhe@tadu.vn