Search
Close this search box.

Exagrid: Scale-Up vs. Scale-Out Architecture in Backup Storage

Các doanh nghiệp đang chứng kiến tốc độ tăng trưởng dữ liệu khoảng 30% hàng năm, nghĩa là tổng lượng dữ liệu của họ sẽ tăng gấp đôi sau mỗi 2,5 năm.

Trước đây, các tổ chức đã chuẩn bị cho sự gia tăng dữ liệu sao lưu theo một trong hai cách. Họ có thể mua quá nhiều máy chủ lưu trữ hoặc bộ điều khiển với hy vọng sẽ dần dần phát triển theo giải pháp đó – một cách làm tốn kém và lãng phí. Hoặc họ có thể sử dụng giải pháp lưu trữ chính tiêu chuẩn truyền thống – mua một giải pháp nhằm đáp ứng nhu cầu lưu trữ tức thời của họ và bổ sung thêm lưu trữ vật lý khi cần thiết. Phương pháp này được gọi là “scale-up.”

Với phương pháp scale-up, các bộ điều khiển hoạt động như điểm truy cập với một lượng cố định các tài nguyên mạng, bộ nhớ và CPU. Việc thêm ổ đĩa vật lý vào kiến trúc hệ thống lưu trữ hiện có chỉ tăng dung lượng lưu trữ mà không làm tăng các tài nguyên về mạng, bộ nhớ hay CPU của bộ điều khiển.

Điều quan trọng cần lưu ý là đối với những tổ chức cần bảo vệ một lượng lớn dữ liệu, thường từ trên 50TB cho đến cả petabyte, hoặc những tổ chức yêu cầu lưu trữ dữ liệu sao lưu trong thời gian dài, việc loại trừ trùng lặp dữ liệu là một thành phần then chốt trong giải pháp lưu trữ sao lưu của họ. Loại trừ trùng lặp dữ liệu chỉ lưu trữ những dữ liệu duy nhất từ các bản sao lưu nhằm giảm chi phí lưu trữ sao lưu. Khi dữ liệu tăng trưởng, tải công việc loại trừ trùng lặp cũng tăng lên, đòi hỏi ngày càng nhiều cổng mạng, bộ xử lý và bộ nhớ.

Thật không may, các thiết bị loại trừ trùng lặp dữ liệu truyền thống như Dell Data Domain và HPE StoreOnce đều sử dụng kiến trúc scale-up. Với những thiết bị này, mặc dù việc loại trừ trùng lặp dữ liệu giải quyết được vấn đề lưu trữ, nhưng lại tạo ra một thách thức mới về khả năng tính toán. Chúng không bổ sung thêm khả năng xử lý theo dung lượng lưu trữ, dẫn đến khả năng xử lý sao lưu bị suy giảm và cuối cùng sẽ không đáp ứng được yêu cầu.

Trong những năm gần đây, một phương pháp mở rộng lưu trữ sao lưu hiệu quả hơn đã xuất hiện – đó là khả năng bổ sung kết hợp giữa lưu trữ và tài nguyên trong một giải pháp thiết bị có khả năng mở rộng và hiệu quả về chi phí. Phương pháp này được gọi là “scale-out.” Với giải pháp scale-out, toàn bộ các thiết bị mới được thêm vào kiến trúc, không chỉ mở rộng dung lượng lưu trữ mà còn bổ sung thêm tài nguyên về mạng, CPU và bộ nhớ vào một tập hợp các thiết bị được kết nối trong một hệ thống duy nhất. Khả năng scale-out này hoạt động một cách thông minh như một hệ thống kết hợp duy nhất (bao gồm cân bằng tải, loại trừ trùng lặp dữ liệu giữa các thiết bị và tăng cường xử lý), mà không gặp phải hạn chế của nút thắt cổ chai ở bộ điều khiển phía trước. Nhờ đó, việc loại trừ trùng lặp dữ liệu có thể dễ dàng theo kịp sự tăng trưởng của dữ liệu.

Phương pháp này có thể được tìm thấy trong các giải pháp lưu trữ sao lưu theo tầng như ExaGrid.

Ảnh hưởng của sự tăng trưởng dữ liệu sao lưu không chỉ dừng lại ở dung lượng đĩa

Sự tăng trưởng dữ liệu sao lưu không chỉ liên quan đến lượng dữ liệu được lưu trữ. Để hỗ trợ sự tăng trưởng này, các đội ngũ IT cần đảm bảo cơ sở hạ tầng lưu trữ sao lưu có khả năng chứa đủ lượng dữ liệu cần thiết theo chính sách lưu trữ của họ, đồng thời đảm bảo rằng quá trình xử lý sao lưu trên hệ thống lưu trữ có thể mở rộng để đáp ứng sự gia tăng lượng dữ liệu sao lưu mà không ảnh hưởng tiêu cực đến quá trình sao lưu. Nếu quá trình sao lưu bị ảnh hưởng, nó có thể gây ra hiệu ứng dây chuyền, với nhiều sự trì hoãn dẫn đến việc sao lưu không hoàn thành trong khung thời gian dự kiến.

Khả năng xử lý dữ liệu sao lưu như một phần của lưu trữ

Lượng dữ liệu có thể đưa vào một giải pháp lưu trữ sao lưu chính là lượng dữ liệu mà hệ thống lưu trữ có thể xử lý trong khoảng thời gian sao lưu không gây gián đoạn cho doanh nghiệp. Điều này rất quan trọng. Các công việc sao lưu phải được hoàn thành trong thời gian ngoài giờ làm việc, gọi là “backup window”. Nếu một giải pháp lưu trữ sao lưu có khả năng nhập 50TB/giờ, thì tốc độ xử lý của nó sẽ đạt 300TB trong một backup window kéo dài 6 giờ. Tổng dữ liệu được xử lý thường bị giới hạn bởi thời gian sao lưu ngoài giờ – trong nhiều trường hợp backup window chỉ từ 6 đến 8 giờ.

Trong các kiến trúc scale-up, con số tốc độ xử lý này chỉ là mức tối đa. Nó không tính đến sự suy giảm hiệu suất khi kích thước dữ liệu nhập tăng lên. Trong một số trường hợp scale-up, tùy thuộc vào giải pháp phần mềm sao lưu được sử dụng, quá trình nhập dữ liệu sao lưu thực hiện trên bộ điều khiển/lưu trữ có thể bị ảnh hưởng bởi các tác vụ như loại trừ trùng lặp, phục hồi và xử lý sao chép. Những hoạt động này có thể làm chậm hoặc giảm lượng dữ liệu có thể được xử lý. Con số nhập dữ liệu đã được ghi nhận trên bất kỳ giải pháp scale-up nào có thể thấp hơn đáng kể so với hiệu suất thực tế.

Người dùng của các kiến trúc scale-up vượt quá giới hạn backup window sẽ gặp phải tình trạng bế tắc – việc không đáp ứng được backup window không phải do thiếu đĩa lưu trữ, mà do bộ điều khiển bị quá tải. Việc thêm nhiều đĩa để mở rộng không phải là giải pháp. Nâng cấp bộ điều khiển lại tạo ra những hệ thống cách ly không chia sẻ dữ liệu, đặc biệt trong quản lý và loại trừ trùng lặp toàn cục. Vậy họ phải làm gì? Người dùng buộc phải đưa vào một hệ thống mới, lớn hơn, đòi hỏi phải di chuyển dữ liệu từ hệ thống cũ – được gọi trong ngành là “rip-and-replace” hoặc “forklift upgrade.”

Tại sao điều này không xảy ra với giải pháp Scale-Out?
Khác với phương pháp scale-up, nơi bạn phải đoán xem cần sử dụng bộ điều khiển phía trước với kích cỡ nào, phương pháp scale-out cho phép bạn chỉ cần bổ sung các thiết bị có kích thước phù hợp khi dữ liệu tăng trưởng.

Kiến trúc scale-out là các thiết bị hoàn chỉnh (bộ xử lý, bộ nhớ, băng thông và ổ đĩa) tích hợp trong một hệ thống duy nhất có thể được nối thêm vào một mạng lưu trữ sao lưu. Khi dữ liệu tăng lên, tất cả các tài nguyên đều được mở rộng, bao gồm cả lưu trữ chính bổ sung, băng thông, bộ xử lý, bộ nhớ và dung lượng ổ đĩa. Điều này giúp giữ cho cửa sổ sao lưu không thay đổi về thời gian, bất kể sự tăng trưởng của dữ liệu, từ đó loại bỏ các lần nâng cấp theo kiểu “forklift upgrade” đắt đỏ.

Khi lựa chọn một hệ thống scale-out, hãy đảm bảo rằng các thiết bị, bất kể kích cỡ hay tuổi đời, có thể được kết hợp trong một hệ thống duy nhất. Điều này cho phép bộ phận IT mua thêm khả năng tính toán và dung lượng lưu trữ theo nhu cầu, hướng đến một giải pháp luôn “mới” (evergreen) và loại bỏ việc lỗi thời của sản phẩm cũng như các lần nâng cấp hệ thống.

Làm thế nào để chọn giải pháp Scale-Out hay Scale-Up phù hợp với bạn?

Các tổ chức có tập dữ liệu tương đối nhỏ và dự kiến mức tăng trưởng thấp trong khoảng 3 đến 5 năm có thể tìm được giải pháp scale-up đáp ứng nhu cầu của họ. Trong khi đó, các doanh nghiệp cần bảo vệ từ 50TB đến hàng petabyte dữ liệu sao lưu và có kỳ vọng về mức tăng trưởng trung bình đến lớn nên xem xét các giải pháp scale-out như ExaGrid, giúp rút ngắn đáng kể cửa sổ sao lưu và giảm thiểu chi phí lưu trữ ban đầu cũng như theo thời gian.