메인 콘텐츠로 건너뛰기
블로그컴퓨팅엣지에서의 생성적 개인화: 이커머스의 미래는 클라우드에 있지 않습니다.

엣지에서의 생성적 개인화: 이커머스의 미래는 클라우드에 있지 않습니다.

엣지에서의 생성적 개인화: 이커머스의 미래는 클라우드에만 있는 것이 아닙니다.

엣지 컴퓨팅은 이커머스에서 개인화를 혁신하고 있습니다. 개인화가 엣지로 이동함에 따라 클라우드는 단순한 매장이 아니라 공장이 되고 있습니다.

다음은 리테일 고객에게 흔히 볼 수 있는 시나리오입니다. 구매자가 홈페이지를 클릭합니다. 고객의 의도는 분명합니다. 5초, 어쩌면 그보다 짧은 시간 내에 고객의 의도를 이해했음을 증명해야 합니다. 하지만 고객이 스크롤 휠을 잡는 순간 지연이 발생합니다. 2,000마일 떨어진 데이터 센터에서 개인화된 콘텐츠가 로드됩니다. 배너가 관련 내용을 표시하도록 업데이트될 때쯤이면 고객은 이미 다른 곳으로 이동한 후입니다.

이것이 바로 클라우드 기반 개인화의 조용한 세금입니다. 이제 선도적인 리테일러들이 다른 질문을 던지고 있는 이유도 바로 여기에 있습니다: 바로 옆집에 인텔리전스가 있다면 어떨까요?

엣지에서의 제너레이티브 AI를 기반으로 하는 개인화의 새로운 지평에 오신 것을 환영합니다. 지연 시간 단축. 개인 정보 보호 강화. 그리고 트래픽이 급증해도 흔들리지 않는 성능.

자세히 살펴보겠습니다.

개인화, 제너레이티브 AI로 강화된 맞춤화

리테일러들은 항상 개인화를 추구해 왔습니다. 하지만 지난 2년 동안 판도가 바뀌었습니다. 제너레이티브 AI가 판도를 바꿨습니다. 대규모 언어 모델(LLM), 이미지 합성, 검색 증강 콘텐츠는 기본적인 추천에서 수작업으로 만든 듯한 실시간 컨텍스트 콘텐츠로 그 목표를 전환했습니다.

실제 비즈니스에서 AI 개인화가 어떻게 활용되고 있는지 몇 가지 사례를 살펴보겠습니다:

유일한 문제는? 이러한 혁신은 인상적이지만, 대부분은 여전히 사용자와 멀리 떨어진 곳에서 이루어집니다. 개인화는 스마트할 수 있지만 거리에 따라 경험에 병목 현상이 발생하여 지연 시간과 페이지 이탈이 발생할 수 있습니다.

LLM이 정말 엣지에서 실행될 수 있을까요?

네. 그리고 점점 더 많은 사람들이 그렇게 하고 있습니다.

양자화, 가지치기, 증류와 같은 공격적인 모델 최적화 기법 덕분에 이제 대규모 모델도 이전에는 불가능했던 곳에서 실행할 수 있을 만큼 충분히 컴팩트해졌습니다. 예를 들어, 4비트 LLaMA 모델(정밀도 가중치를 줄인 Meta의 LLaMA 언어 모델 버전) 또는 10억 개 미만의 파라미터 LLM은 이제 노트북 CPU와 같은 작은 장치에서 초당 약 20개의 토큰을 처리할 수 있습니다. 쉽게 말해, 대규모 클라우드 서버에서만 가능했던 AI가 이제 더 작고 접근성이 높은 환경에서도 작동할 수 있다는 뜻입니다. 최적화는 실시간 생성 AI를 엣지로 가져오고 있습니다. 그리고 이것은 단지 이론적인 것이 아니라 이미 실현되고 있습니다.

Akamai는 엣지 지향 클라우드 인프라를 확장하기 위해 NVIDIA GPU, VPU, 고처리량 CPU를 선별적으로 배치하여 기존의 하이퍼스케일러 데이터센터보다 더 가까운 곳에서 지연 시간이 짧은 추론을 실행할 수 있도록 지원하고 있습니다. 웹어셈블리 (WASM)와 경량 추론 런타임을 추가하면 정적 파일을 캐시하는 것 이상의 작업을 수행할 수 있는 캔버스를 확보할 수 있습니다.

이를 통해 완전히 다른 접근 방식, 즉 전송 지점에서 바로 실행되는 실시간 AI 생성 콘텐츠가 등장했습니다.

CDN을 제너레이티브 엔진으로 전환

엣지에서의 생성적 개인화는 다음과 같이 작동합니다.

사용자가 홈페이지를 방문합니다. 요청은 가장 가까운 엣지 노드(예: 프랑크푸르트에 있는 Akamai PoP)에 도달합니다. 이 노드는 사용자의 코호트 태그( EdgeKV에 저장됨)를 검사하고 지역별 제품 데이터를 기반으로 미세 조정된 경량 생성 모델을 로드한 후 50ms 이내에 개인화된 헤드라인을 생성하고 제품 설명을 다시 작성하거나 해당 프로필에 가장 매력적인 이미지 변형을 선택합니다. 오리진으로 이동하지 않아도 됩니다. 지연도 없습니다.

과거에는 왕복 200밀리초가 걸리던 작업이 이제는 로컬에서 40밀리초 만에 대규모로 이루어질 수 있습니다. 개인화 로직은 전송 계층에 있으므로 빠르고 유연하며 사용자에게 보이지 않습니다. 

개인 정보 보호를 최우선으로 고려한 개인화 설계

엣지 개인화는 개인 정보 보호 우선 전략과 GDPR 준수를 위해 자연스럽게 적합합니다.

데이터를 로컬에서 처리하면 전송을 최소화하고 아키텍처를 통해 데이터 보존을 보장할 수 있습니다. 유럽 사용자는 유럽에서 서비스를 받습니다. 미국 사용자는 미국에서 서비스를 받습니다. 필요한 경우가 아니라면 데이터는 국경을 넘지 않으며, 모든 데이터는 이미 보유하고 있는 퍼스트 파티 컨텍스트 데이터를 기반으로 합니다.

지연 시간, 처리량, 비용: 3개 선택

클라우드 추론 비용은 금액과 밀리초 단위로 모두 합산됩니다. 모든 송신 수수료, 모든 GPU 분 단위가 세금처럼 느껴질 수 있습니다.

엣지에서 제너레이티브 AI 로직으로 전환하면 속도를 높이고 비용을 절감할 수 있습니다. Akamai 벤치마크 따르면 기업은 하이퍼스케일러에 비해 AI 추론 및 에이전트 AI 워크로드를 최대 86%까지 절감할 수 있는 것으로 나타났습니다

또한 엣지의 분산된 특성은 플래시 세일이나 휴일과 같은 이벤트에서 발생할 수 있는 트래픽 급증을 오리진에 영향을 주지 않고 흡수합니다. 따라서 로직이 4000개 이상의 PoP에 분산되어 있다면 단일 오리진 서버가 아닌 네트워크에서 갑작스러운 트래픽 급증을 처리할 수 있습니다.

아직 고민 중이라면 이 점을 고려하세요: Akamai의 엣지 추론 서비스는 기존 클라우드 배포보다 최대 3배 더 많은 처리량을 제공합니다. 따라서 하나의 병목 현상을 다른 병목 현상과 교환하는 것이 아닙니다. 병목 현상을 완전히 제거합니다.

실제로는 어떤 모습일까요?

예를 들어 고객이 마지막으로 구매한 제품이 프리미엄 트레일 러닝화였다고 가정해 보겠습니다. 고객이 2주 후에 사이트를 다시 방문한다고 가정해 보겠습니다. 엣지 함수는 해당 고객의 코호트 및 로컬 벡터 임베딩을 검색하고 엣지에 최적화된 벡터 데이터베이스를 쿼리한 후 메시지를 표시합니다: "이 새로운 트레일 러닝화와 액세서리를 홍보하는 헤드라인을 12단어 이내로 작성하세요."

모델이 밀리초 단위로 응답하고 페이지가 즉시 렌더링됩니다. 구매자는 일반적인 '현재 인기' 위젯 목록 대신 자신의 의도에 맞게 맞춤화된 제품을 보게 됩니다.

깜박임이 없습니다. 백엔드 부하가 없습니다. 기다릴 필요도 없습니다.

이것이 바로 엣지에서의 생성적 개인화의 힘입니다. 그리고 한 번 효과가 나타나면 되돌리기 어렵습니다.

이커머스 개인화의 미래

클라우드는 사라지지 않습니다. 하지만 클라우드는 매장에서 공장으로 역할을 바꾸고 있습니다. 교육은 중앙에서 이루어집니다. AI 개인화는 로컬에서 이루어집니다. 그리고 생성 루프는 매일 더 긴밀하고, 더 빠르고, 더 관련성이 높아집니다.

단순히 더 나은 제품을 보여주는 것이 아닙니다. 더 나은 경험을 제공하는 것입니다. 이것이 바로 Akamai의 엣지 플랫폼이 한 번에 한 밀리초씩 맞춤형으로 구축하는 미래입니다.

엣지에서의 생성적 개인화가 이커머스 경험을 어떻게 변화시킬 수 있는지 알아보세요. 지금 전문가와 상담하세요.

추천 사항

내용

댓글 남기기

이메일 주소는 게시되지 않습니다. 필수 필드가 표시됩니다 *