Я хочу сравнить надежность различных RAID-систем с потребительскими (URE/bit = 1e-14) или корпоративными (URE/bit = 1e-15) дисками. Формула, чтобы иметь вероятность успеха перестроения (игнорируя механические проблемы, которые я буду учитывать позже) проста:
error_probability = 1-(1-per_bit_error_rate)^bit_read
важно помнить, что это вероятность получения хотя бы одного Уре, не обязательно только один.
Предположим, нам нужно 6 ТБ полезного пространства. Мы можем получить его с:
-
RAID1 с 1 + 1 дисками по 6 ТБ каждый. Во время перестроения мы читаем назад 1 диск 6TB и риск является следующим: 1-(1-1e-14)^(6e12*8)=38% для едока или 4,7% для приводов предпринимательства.
-
RAID10 с 2 + 2 дисками по 3 ТБ каждый. Во время перестроения мы читаем только 1 диск объемом 3 ТБ (тот, что в паре с отказавшим!) и риск меньше: 1-(1-1е-14)^(3e12*8)=21% для потребителя или 2.4% для корпоративных дисков.
-
RAID5 / RAID Z1 с 2 + 1 дисками по 3 ТБ каждый. Во время перестроения мы читаем обратно 2 диска по 3 ТБ каждый, и риск составляет: 1-(1-1e-14)^(2*3e12*8)=38% для потребителей или 4,7% или корпоративных дисков.
-
RAID5 / RAID Z1 с 3 + 1 дисками по 2 ТБ каждый (часто используется пользователями продуктов SOHO, таких как Synologys). Во время перестроения мы читаем обратно 3 диска по 2 ТБ каждый, и риск составляет: 1-(1-1e-14)^(3*2e12*8)=38% для потребителя или 4,7% или предприятия приводы.
вычисление ошибки для допуска одного диска легко, сложнее вычислить вероятность с системами, толерантными к отказам нескольких дисков (RAID6/Z2, RAIDZ3).
Если для перестроения используется только первый диск, а второй читается с начала в случае или URE, то вероятность ошибки вычисляется выше квадратного корня (14,5% для потребителя RAID5 2+1, 4,5% для потребителя RAID1 1+2). Однако, я полагаю (в по крайней мере, в ZFS с полными контрольными суммами!) что вторая четность/доступный диск считывается только там, где это необходимо, а это означает, что требуется только несколько секторов: сколько UREs может произойти на первом диске? не так много, иначе вероятность ошибки для однодисковых систем допуска взлетит еще больше, чем я рассчитал.
Если я прав, второй диск четности практически снизит риск до чрезвычайно низких значений.
вопрос в сторону, важно иметь в виду производители увеличивают вероятность появления жестких дисков потребительского класса по маркетинговым соображениям (продают больше дисков корпоративного класса), поэтому ожидается, что даже жесткие диски потребительского класса достигнут 1e-15 URE/bit read.
иные данные: http://www.high-rely.com/hr_66/blog/why-raid-5-stops-working-in-2009-not/
значения, которые я предоставил в скобках (корпоративные диски), поэтому реалистично применяются и к потребительским дискам. И реальные приводы предпринимательства имеют еще более высокая надежность (URE / bit=1e-16).
относительно вероятности механических повреждений, они пропорциональны количеству дисков и пропорциональны времени, необходимому для восстановления.