1년 전 Akamai는 데이터 센터 및 호스트 마이그레이션과 규모 조정 작업을 위해 Linode 플랫폼으로의 웜 마이그레이션을 출시했습니다. 기존의 콜드 마이그레이션에서는 대상 리노드가 종료되고 해당 데이터가 새 호스트로 복사된 후 새 리노드가 부팅됩니다. 웜 마이그레이션은 대상 리노드가 새 호스트에 동기화될 때까지 계속 실행된다는 점에서 기존 콜드 마이그레이션과 다릅니다. 이 시점에서 리노드의 전원이 꺼지고 로컬 NVMe 데이터가 새 호스트에 일대일로 미러링되기 때문에 새 리노드는 이전 호스트에서 재부팅할 때와 똑같이 부팅됩니다. 크기 조정이 필요한 경우, 리노드의 전원이 꺼졌다가 즉시 다시 부팅되는 동안 새 호스트에서 크기 조정이 이루어질 수 있습니다.
이 새로운 기술을 개척한 두 가지 이유는 모두 고객 다운타임, 즉 리노드가 공간을 차지하고 있지만 전원이 꺼져 있는 시간을 해결하는 데 중요한 역할을 합니다. 첫 번째 이유는 콜드 리사이즈(이전에는 리사이징이라고 알려짐)를 수행하려면 마이그레이션이 진행되는 동안 리노드의 전원을 꺼야 하고, 대상 호스트에서 리사이즈가 수행된 다음 새 리노드가 새 호스트에서 부팅되기 때문입니다. 리노드의 크기가 커지면 현재 리노드의 호스트에 공간이 보장되지 않고, 리노드의 크기가 작아지면 새 호스트의 더 나은 하드웨어를 사용할 수 있기 때문에 크기를 조정하려면 마이그레이션이 필요합니다. 규모가 큰 리노드의 경우, 이로 인해 몇 분에서 몇 시간까지 다운타임이 발생했습니다. 저희의 목표는 이 시간을 대폭 단축하는 것이었습니다. 웜 마이그레이션을 개발한 두 번째 이유는 라이브 마이그레이션이 호환되는 CPU 유형 사이에서만 작동할 수 있기 때문입니다. 반면 웜 마이그레이션에는 이러한 제한이 없습니다.
작년부터 고객들이 웜 마이그레이션을 시작했으며, 실제로 얼마나 많은 다운타임을 절약했는지 공유할 수 있게 되어 자랑스럽습니다. 1년 동안 고객들은 58,000개 이상의 리노드에서 11.6페타바이트의 데이터를 웜 마이그레이션하여 총 6,100시간 이상의 다운타임을 절약했습니다. 이 다운타임은 리노드가 전원을 끄지 않고 요청을 처리하고, 고객에게 서비스를 제공하고, 비즈니스를 지원하는 등 Akamai 사용자에게 필요한 모든 작업을 수행하는 동시에 새로운 대상으로 규모를 조정하고 마이그레이션할 수 있었던 시간입니다.
| 마이그레이션된 데이터 | 11.6 | 페타바이트 |
| 마이그레이션 | 58,000 | 리노드 |
| 다운타임 절감 | 6,100 | 시간 |
따뜻한 마이그레이션을 실현하는 데는 엄청난 노력이 필요했지만, 저희는 고객이 플랫폼에서 경험하는 경험을 의미 있게 개선하기 위해 끊임없이 노력하고 있습니다. 회사 전체의 여러 팀이 통합된 비전을 가지고 이 프로젝트를 끝까지 완수하기 위해 협력했으며, 엔지니어의 입장에서 이렇게 큰 영향력을 발휘하는 것을 보면 매우 보람을 느낍니다. 웜 마이그레이션을 사용해 보고 싶으시다면 Cloud 매니저에서 크기 조정 옵션으로 이 기능을 사용할 수 있습니다. 그리고 이와 같이 영향력이 큰 대규모 프로젝트에 관심이 있으시다면 지금 채용 중입니다.

내용