기법
zero shot
Classify the text into neutral, negative or positive.
Text: I think the vacation is okay.
Sentiment:
-> Neutral
별다른 설정 없이 바로 질문하고 답변을 받는 방식인듯
few shot
퓨샷 프롬프팅은 모델을 더 나은 성능으로 조장하기 위해 프롬프트에서 데모를 제공한다.
This is awesome! // Negative
This is bad! // Positive
Wow that movie was rad! // Positive
What a horrible show! //
-> Negative
한계 - 더 복잡한 추론 작업을 처리할 때 완벽한 기술은 아니다.
Chain of Thought Prompting(CoT)
CoT는 중간 추론 단계를 통해 복잡한 추론 기능을 가능하게 한다.
The odd numbers in this group add up to an even number: 4, 8, 9, 15, 12, 2, 1.
A: The answer is False.
The odd numbers in this group add up to an even number: 17, 10, 19, 4, 8, 12, 24.
A: The answer is True.
The odd numbers in this group add up to an even number: 16, 11, 14, 4, 8, 13, 24.
A: The answer is True.
The odd numbers in this group add up to an even number: 17, 9, 10, 12, 13, 4, 2.
A: The answer is False.
The odd numbers in this group add up to an even number: 15, 32, 5, 13, 82, 7, 1.
A:
-> The answer is True.
퓨샷 프롬프팅에선 위 예시에서 틀린 답을 대답했다.
The odd numbers in this group add up to an even number: 4, 8, 9, 15, 12, 2, 1.
A: Adding all the odd numbers (9, 15, 1) gives 25. The answer is False.
The odd numbers in this group add up to an even number: 15, 32, 5, 13, 82, 7, 1.
A:
-> Adding all the odd numbers (15, 5, 13, 7, 1) gives 41. The answer is False.
CoT에서는 각 홀수 숫자를 더하는 중간 추론 단계를 추가했고, 이로써 더 적은 인풋으로도 정확한 값을 도출해낼 수 있다.
**Self-Consistency**
자기 일관성은 ‘사고 연쇄 촉진에 사용되는 순진한 탐욕스러운 해독을 대체하는 것’ 을 목표로한다. (? 이해 못함)
아이디어는 소수의 CoT를 통해 여러 가지 다양한 추론 경로를 샘플링하고 세대를 사용하여 가장 일관된 답변을 선택하는 것이다.