디스크(HDD, SSD, RDX 등)의 수명!

본문

안녕하세요! 

테온의 기술연구소장 강종원입니다.


"디스크"는 컴퓨터, 서버, 스토리지(NAS/SAN), NVR 등의 IT 하드웨어에서 필수로 장착되며

모든 데이터가 저장되는 가장 중요한 "부품"입니다.


저는 서버, 스토리지와 같은 IT 하드웨어의 수명과 디스크의 수명에는 다른 점이 있다고 생각하여

이전 글에서 추가로 글을 작성해 보았습니다.




- 디스크(HDD, SSD 등)의 수명 - 


디스크도 IT 하드웨어 제품과 같이 예상되는 수명이 있습니다.

 

그래서 디스크 업체에서는 보증기간(Warranty)을 정하고

보증기간 이내에는 디스크 교체 서비스를 제공합니다.


디스크의 보증기간은 일반적으로

일반 가정이나 중소기업용(PC, NAS, 보안) 제품은 3년

기업용(엔터프라이즈) 제품은 5년입니다.


SSD의 경우 기간이 아닌 용량에 따른 수명이 하나 더 있습니다.

TBW(TeraBytes that can be Written)라고 하며, SSD에 총 기록 가능한 데이터 양을 뜻합니다.


SSD 구매 시, TBW 항목을 확인할 수 있으며

컴퓨터에 장착 후 크리스탈디스크인포(CrystalDiskinfo) 같은 프로그램으로 확인할 수도 있습니다.


일반적으로는 TBW보다 보증기간이 먼저 만료되지만

미디어 업체와 같이 대용량 데이터 저장 및 삭제가 자주 발생하는 환경에서는

TBW가 먼저 만료될 수 있습니다.



그럼, 디스크의 보증기간이 만료되면 어떻게 될까요? 


디스크도 IT 하드웨어와 마찬가지로

보증기간이 만료되었다고 해서 무조건 바꿔야 하는 건 아닙니다.


하지만 디스크는 오래 사용할수록 베드 섹터가 나타날 확률

각종 기능에 장애가 발생할 확률이 상승합니다.

e13e283d185a9df6e48e77334d01931e_1724052699_044.png


베드 섹터 등의 장애 발생 확률이 상승한다는 의미는

한 번에 여러 개의 디스크가 망가져

조치할 방법 없이 데이터가 유실되는 등의 최악의 상황이 발생할 확률이 높아진다는 뜻입니다.



디스크 장애 대책 -


디스크의 수명은 디스크 장애에 대한 간접적인 원인을 제공하며

외부 충격, 전원 차단 등의 직접적인 원인에 의해서 디스크에 장애가 발생할 수 있습니다.


디스크에 장애가 발생하면

데이터 복구 비용으로 많은 지출이 발생하거나

데이터가 유실되어 업무 마비 등의 상황에 빠지므로


디스크 장애에 대한 대책을 준비하는 것이 꼭! 필요합니다.



첫 번째, 레이드(RAID)와 이레이져코딩(erasure coding)!


다행히 디스크는 레이드, 이레이저코딩 등의 기술을 적용하여

하나 이상의 디스크 장애에 대한 대비를 할 수 있습니다.


기술 타입에 따라 몇 개의 디스크 장애까지 허용하는지 선택할 수 있으며

허용 범위 내에서 디스크 장애가 발생하면

장애 디스크를 교체하여 다시 정상적으로 사용할 수 있습니다.



두 번째, 검사!!


디스크는 베드 섹터나 기능 장애가 발생해도

인식이 되지 않는 등의 눈에 띄는 상황이 발생하지 않을 수 있습니다.


그러한 상황에서도 계속 사용하면 여러 개의 디스크가 동시에 고장 날 수 있습니다.


그러므로, 주기적인 디스크 검사를 통해

디스크에 이상이 있는지 확인하고 이상이 있다면 교체를 진행해야 합니다.


서버의 경우 디스크 업체에서 제공하는 검사 프로그램을 통해

서버에 장착된 디스크를 검사할 수 있으며


스토리지의 경우 보통 디스크 검사 솔루션이 탑재되어 있어

자동 혹은 수동으로 검사를 실시할 수 있지만


정확도가 다소 부족할 수 있어

디스크를 서버에 연결한 후 검사 프로그램으로 검사하는 것이 더욱 정확도를 높일 수 있습니다.



세 번째, 백업!!!


디스크는 자성을 이용한 섬세한 장치로써


직간접적인 영향에 의해 갑자기, 쉽게 고장 날 수 있는 점을 고려하여


디스크 장애에 의한 데이터 유실에 대비해 꼭 데이터를 백업해야 하며


데이터 백업은 외장하드, 클라우드, 스토리지 등


원본 용량 이상의 장소에 따로 저장하는 것을 권해 드립니다.



네 번째, 클라우드!!!!


지난 포스팅에서도 안내한 방법인 클라우드 이용은


클라우드 업체에서 디스크를 포함한 모든 IT 하드웨어를 직접 관리하므로


고객이 디스크의 수명, 장애 등에 대해 걱정하지 않도록 해줍니다.



여기까지 디스크 장애에 대한 네 가지 대책에 대해 알아보았으며


마지막으로 디스크 장애가 발생한 후의 조치사항에 대해 알아보겠습니다!



디스크 교체 -


디스크 장애 발생 시, 추가 장애에 의한 피해를 막기 위해 신속히 정상 디스크로 교체해야 하며


디스크 교체(리빌딩) 과정에서

인위적 실수, 시스템 오류, 전원 차단, 추가 디스크 장애 등에 의해서

사고가 발생할 수도 있는 점을 꼭! 숙지해야 합니다.


실제로 장애 디스크가 아닌 정상 디스크를 탈착하는 등의 사고가 적지않게 발생하여

데이터를 백업한 후의 교체 작업을 권장하지만

시간, 저장소 등에 의해 진행하기 어려운 것이 사실입니다.



보증기간 내의 디스크는 디스크 업체에서 교체 서비스를 받은 후 교체를 진행하면 되지만

보증기간이 지난 디스크는 어떻게 해야 될까요?


디스크는 브랜드, 용량, 인터페이스, 버퍼, 회전속도 등 다양한 규격을 갖고 있습니다.


디스크 교체 시, 기존 디스크와의 동일한 디스크로 교체하는 것이 좋지만

보통 보증기간이 지난 디스크는 단종되어 더 이상 구매하기가 어렵습니다.


그래서 디스크 업체에서 출시한 기존 디스크의 상위버전으로 교체하거나

최대한 동일한 규격으로 맞추어 교체를 진행해야 하며


여기서 주의할 점은, 호환 문제가 발생할 수 있으므로

하드웨어와 디스크의 호환을 꼭! 확인해야 합니다.


감사합니다.