개인화는 기계 학습, 특히 상황에 맞는 다중 무장 밴딧 알고리즘을 사용하여 개별 사용자가 목표를 달성할 수 있는 최적의 경험을 결정합니다. 우리의 경우 목표는 특정 Google Analytics 이벤트의 총 매개변수 값 또는 총 수를 최적화하는 것입니다.
상황별 다중 암 적기 알고리즘이란 무엇입니까?
"multi-armed bandit"은 여러 경로 목록에서 가장 높고 가장 신뢰할 수 있는 보상으로 이어지는 경로를 지속적으로 선택하려는 상황을 설명하는 데 사용되는 은유입니다. 이것을 시각화하기 위해 슬롯 머신이 한 줄의 슬롯 머신 앞에 있는 도박꾼의 은유를 사용할 수 있습니다. 슬롯 머신은 손잡이(또는 팔)가 하나이고 돈을 가져가기 때문에 구어적으로 "외팔 강도"라고 합니다. 우리는 여러 개의 "팔"을 풀고 싶기 때문에 한 팔을 가진 적기는 여러 팔을 가진 적기가 됩니다.
예를 들어, 세 가지 옵션이 있고 어떤 것이 가장 신뢰할 수 있는 보상을 제공하는지 결정하고 싶다고 가정해 보겠습니다. 각 옵션을 시도한 다음 결과를 받은 후 가장 많은 보상을 제공하는 암을 계속 선택할 수 있습니다. 이것은 욕심 많은 알고리즘이라고 하는 것입니다. 처음 시도할 때 최상의 결과를 산출하는 옵션은 계속 선택하게 됩니다. 그러나 우리는 이것이 항상 작동하지 않을 수도 있다는 것을 이해할 수 있습니다. 우선 높은 보상은 요행일 수 있습니다. 또는 해당 기간 동안 더 높은 보상을 받았지만 나중에는 효과적이지 않은 일부 사용자별 컨텍스트가 있을 수 있습니다.
따라서 알고리즘을 보다 효과적으로 만들기 위해 컨텍스트 가 추가됩니다. 원격 구성 개인화의 경우 이 초기 컨텍스트는 실험에 약간의 엔트로피를 제공하는 무작위 샘플링 또는 불확실성 입니다. 이것은 " 상황 에 맞는 다중 암 적기"를 구현합니다. 실험이 계속 진행됨에 따라 지속적인 탐색과 관찰을 통해 어떤 팔이 모델에 대한 보상을 이끌어낼 가능성이 가장 높은지에 대한 실제 학습된 컨텍스트를 추가하여 모델을 더욱 효과적으로 만듭니다.
이것이 내 앱에 의미하는 바는 무엇입니까?
이제 앱의 맥락에서 multi-armed bandit 알고리즘이 무엇을 의미하는지 논의해 보겠습니다. 배너 광고 클릭을 최적화한다고 가정해 보겠습니다. 이 경우 개인화의 "팔"은 사용자에게 표시하려는 다양한 배너 광고를 나타내기 위해 지정하는 대체 값 입니다. 배너 광고 클릭은 목표 라고 하는 보상입니다.
개인화를 처음 시작할 때 모델은 각 개별 사용자에 대한 목표를 달성할 가능성이 더 높은 대체 값을 알지 못합니다. 개인화가 목표 달성 가능성을 이해하기 위해 각 대체 값을 탐색함에 따라 기본 모델은 더 많은 정보를 얻고 각 사용자에 대한 최적의 경험을 예측하고 선택하는 능력을 향상시킵니다.
개인화는 24시간의 고정 창 을 사용합니다. 이것은 개인화 알고리즘이 단일 대체 값을 탐색하는 시간입니다. 각 대체 값을 여러 번 탐색할 수 있는 충분한 시간(일반적으로 약 14일)을 개인화에 제공해야 합니다. 이상적으로는 앱과 사용자 행동이 변화함에 따라 지속적으로 개선하고 적응할 수 있도록 지속적으로 실행되도록 할 수 있습니다.
추가 메트릭 추적
원격 구성 개인화는 또한 최대 2개의 추가 메트릭을 추적하는 기능을 제공하여 결과를 맥락화하는 데 도움이 됩니다. 소셜 앱을 개발했고 사용자가 친구와 콘텐츠를 공유하도록 장려하여 전반적인 참여를 늘리도록 다양한 대체 값을 설정했다고 가정해 보겠습니다.
이 경우 link_received
와 같은 애널리틱스 이벤트에 대해 최적화하도록 선택하고 두 측정항목을 user_engagement
및 link_opened
로 설정하여 사용자 참여 및 사용자가 여는 링크 수가 증가(실제 참여) 또는 감소(스팸 링크가 너무 많을 수 있음) 여부를 이해할 수 있습니다. ).
이러한 추가 메트릭은 개인화 알고리즘에 고려되지 않지만 개인화 결과와 함께 이를 추적하여 전체 목표를 달성하는 개인화의 능력에 대한 귀중한 통찰력을 제공할 수 있습니다.
개인화 결과 이해
개인화가 데이터를 수집할 수 있을 만큼 오랫동안 실행된 후에는 해당 결과를 볼 수 있습니다.
개인화 결과를 보려면:
결과 페이지에는 개인화가 기준선 그룹에 대해 제공하는 총 상승 도 또는 성능의 백분율 차이가 요약됩니다.
또한 결과 페이지에는 개인화의 현재 상태, 개인화 속성 및 다음과 같은 대화형 그래프가 표시됩니다.
기준선에 대해 개인화가 어떻게 수행되었는지에 대한 자세한 일별 및 전체 보기를 표시합니다.
각 값이 기준선 그룹에서 전반적으로 어떻게 수행되는지 보여줍니다.
요약 상단에 있는 탭을 사용하여 액세스할 수 있는 선택한 추가 메트릭에 대한 목표 결과 및 성과를 표시합니다.
개인화는 무기한 실행될 수 있으며 계속해서 결과 페이지를 다시 방문하여 성능을 모니터링할 수 있습니다. 알고리즘은 사용자 행동이 변경될 때 적응할 수 있도록 계속 학습하고 조정합니다.