next up previous contents
Next: A integração Up: Alta Disponibilidade Previous: Monitoramento mútuo e a   Sumário

Heartbeat

Para realizar o monitoramento mútuo entre dois nós poderíamos utilizar o Mon da maneira que foi descrita anteriormente: verificar, através do uso do ping no IP de serviço, o estado da outra máquina, mas logo percebemos que este é apenas o início de uma solução, pois a seguir deveríamos ter um meio de inicializar os serviços necessários, montar as partições de DRBD, RAID compartilhado ou similar assumir o IP de serviços, etc.

Ainda mais, nem sempre uma falha no servidor primário é uma queda da máquina como um todo, muitas vezes é apenas uma falha em algum serviço, mas a máquina continua operacional. Neste caso o servidor primário deve ficar ciente de que o servidor secundário está assumindo e liberar os recursos para não ocasionar uma ``Split Brain Syndrome''.

Uma ferramenta que permite fazer isto tudo é um programa denominado Heartbeat.

Como o próprio nome sugere, o Heartbeat funciona como um pulso cardíaco que avisa o nó secundário que o primário está vivo, como ilustrado na figura [*].



Figura: Operação do Heartbeat
[width=5cm]img/heartbeat.eps



O pulso do Heartbeat pode ser transmitido através de uma interface serial, ou ethernet e há a possibilidade de se enviar diversos pulsos simultaneamente para que o Heartbeat não se torne um SPOF. De fato é aconselhável ter duas interfaces de pulso, uma serial e uma ethernet, como indicado na figura [*].

A função do Heartbeat, além de enviar o pulso, é inicializar e desligar os serviços que o cluster estará oferecendo, assim como o IP do cluster.

Claro que neste tipo de configuração não desejamos que as máquinas iniciem os serviços logo na inicialização, porque o nó secundário não deve assumir tais serviços a menos que o nó primário caia.

Nos arquivos de configuração dizemos ao programa quais são os serviços pelos quais ele é responsável e, no nó primário serão inicializados de imediato, mas no nó secundário, só será inicializado o monitor do pulso e apenas em caso de falha de recebimento do pulso após um timeout5 estipulado os serviços serão assumidos e o IP será tomado.


next up previous contents
Next: A integração Up: Alta Disponibilidade Previous: Monitoramento mútuo e a   Sumário
Guilherme Tomas O'Connor de Lungarzo 2004-02-27