Při pokusu o spuštění druhé instance v clusteru RAC se dvěma uzly se druhá instance nespustí. Pokud je spuštěna instance na uzlu1, instance na uzlu2 se nespustí. Pokud je spuštěna instance na uzlu2, instance na uzlu1 se nespustí. Protokol výstrah zobrazuje následující:
Error: KGXGN polling error (15)
Errors in file /u01/app/oracle/diag/rdbms/bsp/bsp1/trace/bsp1_lmon_9151.trc:
ORA-29702: error occurred in Cluster Group Service operation
LMON (ospid: 9151): terminating the instance due to error 29702
Bohužel, trasovací soubor LMON poskytuje pouze stejné chybové zprávy, takže tam není nic, co by se dalo dělat.
K této chybě dochází z důvodu nesprávné konfigurace propojení clusteru. Pokud se podíváte na OCR a uvidíte propojení clusteru, uvidíte, že zařízení NIC je eth4.1338:
[oracle@myhost bin]$ oifcfg getif -global
eth2 192.168.33.0 global public
eth4.1338 10.0.0.0 global cluster_interconnect
Na jednom uzlu je zařízení eth4 správné. Na druhém uzlu je však zařízení eth5.1338 a OCR je sdíleno mezi uzly. OCR očekává, že zařízení bude eth4.1338. Oba servery potřebují, aby propojení clusteru bylo na stejném síťovém zařízení. Konfigurace sítě serveru byla změněna tak, že oba uzly byly nakonfigurovány na zařízení eth5.1338. Jakmile byly servery nakonfigurovány identicky, předefinovali jsme konfiguraci OCR:
[oracle@myhost bin]$ ./oifcfg setif -global eth5.1338/10.0.0.0:cluster_interconnect
Při pohledu na konfiguraci vidíme, že eth4 i eth5 jsou stále v OCR:
[oracle@myhost bin]$ ./oifcfg getif -global
eth2 192.168.33.0 global public
eth4.1338 10.0.0.0 global cluster_interconnect
eth5.1338 10.0.0.0 global cluster_interconnect
Odebereme tedy zařízení eth4:
[oracle@myhost bin]$ ./oifcfg delif -global eth4.1338/10.0.0.0
Nyní jsme překonfigurovali OCR. Restartovali jsme CRS a obě instance se objevily na obou uzlech!
Toto byla jedna z těch chyb, kde chybové zprávy ve skutečnosti neukazovaly na hlavní příčinu problému. Místo toho jsem se musel šťourat v oblastech, které jsem považoval za nejpravděpodobnější viníky, když jsem spíše slepě objevil rozdíly v konfiguraci.