Nếu bạn từng nhìn vào hệ thống NAS đang chạy cấu hình RAID với ổ cứng HDD và tự hỏi liệu việc chuyển sang SSD có mang lại hiệu quả vượt trội, bạn không đơn độc. Nhiều người cho rằng nếu RAID có thể giúp ổ đĩa chậm truy cập dữ liệu nhanh hơn, thì với ổ đĩa nhanh như SSD, tốc độ sẽ còn ấn tượng hơn nữa, phải không? Tuy nhiên, đó chỉ là một phần của câu chuyện, và những yếu tố khác cần xem xét lại quan trọng hơn nhiều trong trường hợp này.
Khái niệm RAID – Redundant Array of Inexpensive Disks (Mảng dự phòng của các ổ đĩa giá rẻ) – ban đầu được phát minh để khắc phục các vấn đề cố hữu của ổ cứng HDD, bao gồm độ tin cậy, chi phí và hiệu suất. Dữ liệu được lưu trữ trên nhiều ổ đĩa để cung cấp khả năng dự phòng và sửa lỗi, hoặc để đạt tốc độ và băng thông tối đa, hoặc kết hợp cả ba tùy biến chính.
Tuy nhiên, những khái niệm ban đầu về mảng RAID đã được thay thế bằng việc áp dụng dự phòng ở cấp khối nhỏ hơn thay vì cấp ổ đĩa. Các mảng RAID của SSD chủ yếu được sử dụng để bảo vệ chống mất dữ liệu khi một ổ đĩa gặp sự cố, chứ không phải để tăng tốc độ. Trên thực tế, việc tăng tốc độ bổ sung của RAID truyền thống có thể gây hại cho SSD của bạn và khiến chúng bị hao mòn nhanh hơn, điều này không hề tốt cho dữ liệu quý giá của bạn.
Dữ liệu của bạn có giá trị đến mức nào?
Lưu trữ SSD có thể khiến dữ liệu biến mất trong chớp mắt
Các mảng RAID được thiết kế hàng thập kỷ trước để khắc phục một số vấn đề cố hữu trong ổ cứng quay khi lưu trữ lượng lớn dữ liệu qua kết nối mạng, với nhiều người dùng cùng truy cập máy chủ. Nhiều vấn đề trong số này được giải quyết đơn giản bằng cách sử dụng SSD trong một vùng lưu trữ (storage pool), sau đó sao lưu các vùng này (mirroring pools), thay vì tạo mảng RAID từ các ổ đĩa riêng lẻ.
Có những trường hợp bạn có thể sử dụng lưu trữ RAID toàn flash. Các nhà cung cấp doanh nghiệp chủ yếu sử dụng nó như một công cụ phòng ngừa mất dữ liệu với các cấu hình nhân bản (mirrored) hoặc phân tách chẵn lẻ (striped parity) để việc mất một ổ đ đĩa không làm mất tất cả dữ liệu. Chúng cũng được dùng cho một số trường hợp đặc biệt khi di chuyển lượng lớn dữ liệu trong mạng lưới công ty.
Đúng, bạn có được hiệu suất tăng lên từ các mảng RAID SSD, nhưng bạn cũng phải đối mặt với sự gia tăng hao mòn đối với bộ nhớ NAND và áp lực lên bộ điều khiển, cả hai yếu tố này đều góp phần làm giảm tuổi thọ. Và khi một SSD có thể hỏng bất cứ lúc nào với ít dấu hiệu cảnh báo hơn so với HDD, đó không phải là rủi ro mà nhiều người sẵn sàng chấp nhận.
Việc này không thành vấn đề nếu dữ liệu bạn đang lưu trữ là tạm thời, hoặc bạn có thể tải xuống lại nhanh chóng nếu ổ đĩa hỏng. Chẳng hạn như các tệp máy chủ game (miễn là các tệp cấu hình được sao lưu ở nơi khác), hoặc sao lưu thư viện Steam của bạn để tiết kiệm băng thông tải xuống, hoặc các tệp Apple Music đã tải xuống để sử dụng ngoại tuyến.
Sẽ không có gì to tát nếu dữ liệu biến mất và bạn có thể lấy lại nó chỉ với một chút thời gian. Nhưng sẽ là vấn đề lớn nếu các SSD đó đang chứa các bản sao lưu ảnh, tài liệu công việc hoặc bất kỳ thứ gì khó thay thế. Khôi phục dữ liệu SSD không đơn giản như từ ổ cứng HDD, và nếu một ô nhớ đã mất dữ liệu, bạn sẽ không thể khôi phục được.
Bạn có thể không nhận thấy sự tăng tốc đáng kể
Mạng gia đình có thể là nút cổ chai của bạn
Đây là một điểm khác về SSD—chúng thường nhanh hơn các phần khác của chuỗi truyền dữ liệu. Nếu bạn đang sử dụng mảng RAID từ cùng một máy, giới hạn của bạn là bộ kết nối vật lý, dù là SATA, PCIe hay SAS. Và bạn chỉ tăng tốc độ truyền tải tuyến tính với RAID, chứ không phải IOPS ngẫu nhiên, vốn thường quan trọng hơn. Một lần nữa, bạn không sử dụng mảng RAID của SSD để cải thiện tốc độ, mà chủ yếu là để tăng độ tin cậy và giảm khả năng mất dữ liệu toàn bộ.
Nếu bạn đang lấy dữ liệu qua mạng, tốc độ mạng sẽ là nút cổ chai trừ khi bạn đang sử dụng NVMe và cáp quang. Nếu vậy, bạn đang ở một đẳng cấp hoàn toàn khác so với những gì chúng ta đang chạy trong các phòng lab tại nhà, và mọi quyền lực hơn đều thuộc về bạn. Cho đến khi những công nghệ đó rẻ hơn, chúng ta thực sự không cần các mảng RAID SSD.
Nhưng SSD cache cho HDD RAID arrays là một điều tốt
Mặc dù bạn có thể kết hợp SSD và HDD vào cùng một mảng RAID về mặt kỹ thuật, bạn đang lãng phí tốc độ vì bộ điều khiển RAID sẽ chờ các hoạt động hoàn tất trước khi bắt đầu tiếp theo, vì vậy ổ đĩa chậm nhất của bạn sẽ là giới hạn. Thay vào đó, hãy đặt một (hoặc hai) SSD phía trước mảng RAID đó làm bộ nhớ cache, và bạn sẽ ngay lập tức nhận thấy sự tăng tốc đáng kể. Miễn là SSD của bạn lớn hơn tệp (hoặc các tệp) bạn đang truyền cùng một lúc, nó sẽ lưu toàn bộ vào bộ nhớ cache trong thời gian ngắn, và sau đó ghi vào mảng HDD theo thời gian riêng của nó.
Bạn có thể tạo RAID toàn flash, nhưng có lẽ bạn không cần chúng
NAS Synology DiskStation DS1019+ với khe cắm SSD M.2, minh họa giải pháp lưu trữ flash.
Không ai ở đây tranh cãi rằng các mảng RAID toàn flash không nhanh. Chúng rất nhanh, nhưng liệu chúng có cần thiết cho trường hợp sử dụng của bạn? Ngay cả trong môi trường doanh nghiệp, chúng không phổ biến và được sử dụng để giảm thiểu mất dữ liệu khi truyền sang các mảng HDD chậm hơn hoặc làm bộ nhớ tạm thời để giảm áp lực mạng. Rất có thể, mạng gia đình của bạn không chịu loại áp lực tương tự, và bạn thực sự không cần chi tiêu cho nhiều SSD NVMe hoặc SATA chỉ để lưu trữ máy chủ Jellyfin của mình. Trừ khi bạn thực sự muốn, vì đó là hệ thống của riêng bạn.