Um SPOF, ou Ponto Único de Falha, é um recurso que é único e é essencial ao funcionamento do sistema simultaneamente.
Uma falha em um SPOF representa uma queda no sistema, já que ele é por definição um recurso essencial. Para se atingir Alta Disponibilidade desejamos eliminar tantos SPOF's quanto possível, o que quer dizer que o recurso deve deixar de ser essecial ou único.
Como ser essencial costuma ser uma característica inerente ao sistema, a eliminação de SPOF's geralmente gira em torno da duplicação dos recursos para que deixem de ser únicos.
Exemplos típicos de SPOF's são
Além destes e, talvez, o mais importante seja o disco rígido. O disco rígido não só é mais provável de falhar, já que é o único componente com partes mecânicas, sujeito a desgaste e mais frágil em relação a choques mecânicos, também é responsável pelo armazenamento dos dados que são a parte mais preciosa do sistema. Quase sempre, a perda de dados é muito mais prejudicial do que a perda de hardware.
A perda de dados pode acarretar na total aniquilação do sentido de existência do serviço, portanto é a primeira coisa que desejamos proteger. A maneira mais elementar de fazer isto é através de backups.
No entanto fazer backups não chega a caracterizar Alta Disponibilidade stricto senso porque não aumenta diretamente o uptime. Uma primeira abordagem à eliminação de SPOF's e, portanto à Alta Disponibilidade é a utilização de Dispositivos redundantes como o RAID.