[System Crash 의 종류]
1) Panic - 하드웨어 및 소프트웨어 문제로 더 이상 시스템 운영을 진행할 수 없는 문제에 봉착 했을 때 발생 - 시스템이 적절하게 shutdown이 되지 않았을 경우 부팅하는 동안에도 발생할 수 있음. - HPMC에 의한 패닉일 경우, 콘솔상에 HPMC tombstone 메세지가 나타남. (tombstone : 문제해결을 위한 레지스터값의 리스트 정보) - coredump 를 dump device 에 떨어뜨리고 재기동되며, 부팅완료후 dump device 의 coredump 가 file system 으로 copy 됨. - 대부분 reboot 후 해결되나 최악의 경우 OS 재설치 or 깨진 파일 복구 필요
2) TOC - Application 이나 시스템의 hang으로 판단되는 경우, MC/SG에 의한 TOC - Oracle RAC 문제시 자주 발생
3) HPMC : High priority machine check. - fatal error로 인해 시스템이 더이상 동작할수 없는 상태이며 리부팅을 필요로 함. - 하드웨어 문제가 대부분이고 간혹 소프트웨어적인 문제가 원인이 될수 있음 - /var/tombstomes/ts99 파일을 rc에 분석 요청 (HPMC time stamp 가 찍혀있는지 확인) - 오류가 발생한 HW는 즉시 교체해야함.
4) LPMC : Low priority machine check - automatically correctable error - crash를 유발하지는 않았지만, 큰 장애로 이어질 수 있는 문제
|