본문으로 건너뛰기

기법

zero shot

Classify the text into neutral, negative or positive.
Text: I think the vacation is okay.
Sentiment:

-> Neutral

별다른 설정 없이 바로 질문하고 답변을 받는 방식인듯

few shot

퓨샷 프롬프팅은 모델을 더 나은 성능으로 조장하기 위해 프롬프트에서 데모를 제공한다.

This is awesome! // Negative
This is bad! // Positive
Wow that movie was rad! // Positive
What a horrible show! //

-> Negative

한계 - 더 복잡한 추론 작업을 처리할 때 완벽한 기술은 아니다.

Chain of Thought Prompting(CoT)

CoT는 중간 추론 단계를 통해 복잡한 추론 기능을 가능하게 한다.

The odd numbers in this group add up to an even number: 4, 8, 9, 15, 12, 2, 1.
A: The answer is False.
The odd numbers in this group add up to an even number: 17, 10, 19, 4, 8, 12, 24.
A: The answer is True.
The odd numbers in this group add up to an even number: 16, 11, 14, 4, 8, 13, 24.
A: The answer is True.
The odd numbers in this group add up to an even number: 17, 9, 10, 12, 13, 4, 2.
A: The answer is False.
The odd numbers in this group add up to an even number: 15, 32, 5, 13, 82, 7, 1.
A:

-> The answer is True.

퓨샷 프롬프팅에선 위 예시에서 틀린 답을 대답했다.

The odd numbers in this group add up to an even number: 4, 8, 9, 15, 12, 2, 1.
A: Adding all the odd numbers (9, 15, 1) gives 25. The answer is False.
The odd numbers in this group add up to an even number: 15, 32, 5, 13, 82, 7, 1.
A:
-> Adding all the odd numbers (15, 5, 13, 7, 1) gives 41. The answer is False.

CoT에서는 각 홀수 숫자를 더하는 중간 추론 단계를 추가했고, 이로써 더 적은 인풋으로도 정확한 값을 도출해낼 수 있다.

**Self-Consistency**

자기 일관성은 ‘사고 연쇄 촉진에 사용되는 순진한 탐욕스러운 해독을 대체하는 것’ 을 목표로한다. (? 이해 못함)

아이디어는 소수의 CoT를 통해 여러 가지 다양한 추론 경로를 샘플링하고 세대를 사용하여 가장 일관된 답변을 선택하는 것이다.