De um servidor comercial, cuja falha pode debilitar o impacto de uma marca devido à uma longa permanência offline-- a servidores de missão crítica, como equipamento hospitalar e aeroportuário, cuja falha pode acarretar em perda de vidas e desastres-- a necessidade e o esforço de manter um servidor disponível o maior tempo possível nos leva ao desenvolvimento de clusters de ``Alta disponibilidade''.
Clusters, ou aglomerados de computadores são conjuntos de máquinas que trabalham cooperativamente por um objetivo comum, compondo um sistema computacional único, porém distribuído entre diversos nós.
Alta disponibilidade é o conceito por trás do esforço de manter um serviço eletrônico online o maior tempo possível, mesmo atravessando falhas de sistema, de hardware, manuntenção, upgrades1, etc.
Um exemplo trivial de preocupação com alta disponibildade é o uso, já canonizado, de no-breaks. Os no-breaks são equipamentos que fornecem uma segunda fonte de energia. No caso de uma falha no fornecimento de energia, o no-break se encarrega de supri-la por algum tempo. Uma preocupação maior com a disponibilidade de energia para equipamento envolveria ter um gerador, já que o tempo de atuação de um no-break não é muito grande.
No entanto,em um sistema computacional, as falhas estão longe de se resumir ao fornecimento de energia. Existem diversas falhas pontuais que podem ocorrer durante o funcionamento de um servidor. Embora o exemplo de corte no fornecimento de energia seja um exemplo trivial ele exemplifica bem a idéia de que Alta Disponibilidade não é simplesmente instalar certos programas e ir embora, como pode parecer ao iniciar o contato com o assunto.
Alta Disponibilidade é, acima de tudo, uma política de concepção, instalação, manutenção e administração de um sistema computacional de modo a maximizar o uptime2 dentro de padrões pré-estabelecidos de necessidade.
Por exemplo, o uso de um no-break (e eventualmente um gerador), contribui para a Alta Disponiblidade na medida em que prevê uma solução para o caso de haver falta de energia em algum momento em que o sistema seja necessário. No entanto, isso não quer dizer que o sistema seja necessário numa base 7x24, ou seja, sete dias por semana, vinte e quatro horas por dia. Significa apenas que quando o sistema for necessário, ele funcionará por um tempo conhecido mesmo sem fornecimento de eletricidade.
Embora as medidas envolvidas para se atingir Alta Disponibilidade sejam as mais variadas possíveis, chegando mesmo a incluir medidas como proibir líquidos e comida nas imediações do equipamento, o foco de pesquisa do assunto gira em torno da eliminação de SPOFs.