Abstract:

  • LLM은 단순히 사람과의 상호작용뿐 아니라 인간 캐릭터와 비인간적 객체 또는 시스템의 역할을 맡아 행동을 시뮬레이션 할 수 있음.
  • 이러한 Role Playing(역할 수행) 이 LLM 의 추론 능력에 영향을 크게 미친다고 함.
  • 그리고 Role Prompting 이 CoT 를 더 효과적으로 일으킨다고도 함.

 

Role-Play Prompting 방법:

  • 기존의 Role-play Prompting 은 역할 지정과 추론 질문을 하나의 프롬프트로 결합하여 모델에 질의하는 단일 대화 방식이었음.
  • 이 연구에선 단일 대화 방식에서 두 라운드 대화 과정으로 전환할 것을 제안함:
  • 이는 모델이 지정된 역할에 더 깊이 몰입하게 하여, 추론 능력을 더욱 향상시키는 목적을 가지고 있음.
  • 첫 번째 라운드: 모델이 자신의 지정된 역할에 대해 설명하는 과정. 이를 통해 모델이 역할과 인물에 대해 깊이 이해하게 하고, 역할에 더 몰입하게 만듬.
  • 두 번째 라운드: 첫 번째 라운드에서 설정된 역할에 맞춰 추론 질문에 답변

 

Role-play Prompting 두 가지 프롬프트 설정

  • Role-Setting Prompt(역할 설정 프롬프트):
    • 이 프롬프트는 사용자가 설계하며, LLM이 수행해야 할 특정 역할을 명확하게 정의.
    • 프롬프트는 주어진 작업에 맞게 역할을 구체적으로 설명하고, LLM이 대화 전체에서 맡을 역할을 설명하는데 중점.
    • 추가적인 설명을 프롬프트에 포함시키면, 그 역할의 이점을 더욱 강조할 수 있으며, 이는 결과를 개선하는데 도움이 됨.
    • 역할 설정 프롬프트는 역할의 강점을 부각시켜야함.
  • Role-Feedback Prompt(역할 피드백 프롬프트):
    • 프롬프트는 역할 설정 프롬프트에 대한 모델의 응답으로, LLM이 설정된 역할을 인지하고, 그 역할에 맞게 더 몰입하도록 유도
    • 모델의 샘플링된 응답들 중에서, 가장 몰입도가 높고 대표적인 답변을 선택하여 최종 Role-Feedback Prompt로 사용
    • 이렇게 함으로써 모델이 원하는 역할을 잘 이해하고 그 역할에 맞게 더 나은 추론을 수행할 수 있도록 유도
  • 역할 설정 및 피드백 프롬프트이 핵심임. 이 두 프롬프트를 잘 설계하면, LLM의 성능이 제로샷 방식보다 우수한 결과를 낼 수 있다.
  • 연구에서는 이 프롬프트들을 수작업으로 설계하고 샘플링하여 뛰어난 성과를 거두었으나, 이 과정은 시간이 많이 소요되는 과정이긴 함.
  • 이런 문제를 해결하기 위해서 수작업 없이 자동으로 최적의 역할과 프롬프트를 선택하는 방법이 필요하긴 하다.

 

https://arxiv.org/pdf/2308.07702

+ Recent posts