추론의 환상
LLM에서 추론의 환상은 일관되고 상황에 맞는 텍스트를 생성하는 능력에서 비롯됩니다. 프롬프트 또는 질문이 제시되면 LLM은 논리적 사고의 결과 인 것으로 보이는 응답을 생성 할 수 있습니다. 그러나 이것은 주로 확률 론적 특성과 방대한 양의 텍스트 데이터에 대해 훈련을 받았다는 사실 때문입니다. LLM은 본질적 으로이 데이터 내에서 패턴과 연관성을 학습하여 주어진 맥락에서 다음 단어 나 문구를 예측할 수 있습니다.
지능과 추론에 대한 Wozniak의 관점
Hackers Wanted에서 Steve Wozniak이 제기 한 흥미로운 점 - 2009 우리가 자주 지능을 정의하는 방식에 대한 비판 :
“그래서 우리는 우리가 가르치는만큼 생각을 가르치지 않습니다. 엄격한 rote. 그리고 지능은 모든 가능성을 생각하고 생각하고 생각할 수있는 뇌를 가진 사람으로 정의되지 않습니다. 오, 아니오! 지능은 다른 모든 사람들과 똑같은 것을 말하고 있습니다. 같은 신문을 읽었습니다. 당신은 같은 책을 읽었습니다. 그리고 당신은 당신이 어떻게 작품을 읽었을지를 정확히 알 수 있습니다. 거의 종교와 같은 것입니다. 그리고 당신의 솔루션을 모아서 우리는 그것을 지능적으로 정의하지 않습니다.”
이 통찰력은 LLMS에 대한 중요한 질문을 강조합니다. 우리는 모델이 다양하고 창의적 인 방식으로 진정으로 "생각"하도록 가르 칠 수 있습니까, 아니면 단순히 그들이 훈련 된 사회적 규범과 패턴을 모방 할 것인가?
추론 이해
추론은 핵심적으로 주어진 정보 나 증거를 바탕으로 결론을 내리거나 추론 할 수있는 능력을 포함합니다. 논리, 비판적 사고 및 문제 해결 기술의 적용이 필요합니다.
일부 유형의 추론 :
LLM은 사전 학습 패턴을 통해 이러한 형태 중 일부를 모방 할 수 있지만, 진정한 추론에는 고의적 인인지 프레임 워크가 필요합니다.
고의적 인인지 틀은 다음과 같은 구조적 정신적 접근법입니다.
본질적으로, 그것은 자동 응답이나 미리 학습 패턴을 넘어서는 생각의 방식입니다. 정보에 대한 적극적인 참여, 정보에 입각 한 판단을하는 능력 및 문제를 창의적으로 해결할 수있는 능력이 필요합니다.
범죄를 해결하는 형사를 상상해보십시오.
고의적 인인지 틀은 다음과 같습니다.
대조적으로, 간단한 패턴 매칭 시스템은 다음과 같습니다.
강화 학습을 통해 LLM의 추론 구현
참고 : OpenAi O1의 기능의 핵심에는 대규모 강화 학습 알고리즘이 있습니다. 이 접근법은 모델에 정확한 솔루션으로 이어지는 사고의 사슬을 생성하도록 장려함으로써 생산적으로 생각하는 방법을 가르칩니다.
Python 예제 : GPT3.5 + COT로 해결 된 딸기 문제 "추론"
from openai import AzureOpenAI
# Define constants
AZURE_OPENAI_ENDPOINT = ""
AZURE_OPENAI_API_KEY = ""
az_client = AzureOpenAI ( azure_endpoint = AZURE_OPENAI_ENDPOINT , api_version = "2023-07-01-preview" , api_key = AZURE_OPENAI_API_KEY )
ai_response = az_client . chat . completions . create (
model = "gpt-35-turbo" ,
messages = [
{ "role" : "user" , "content" : "Count the occurrences of the letter 'r' in the word 'strawberry'." },
]
)
print ( "gpt-35-turbo" )
print ( ai_response . choices [ 0 ]. message . content )
print ( "------------" )
ai_response = az_client . chat . completions . create (
model = "gpt-35-turbo" ,
messages = [
{ "role" : "user" , "content" : "Count the occurrences of the letter 'r' in the word 'strawberry'." },
{ "role" : "system" , "content" : """
<chain of thought>
EXAMPLE: Count the occurrences of the letter 'p' in the word 'apple'.
To determine the number of occurrences of the letter 'p' in the word 'apple', we scan through the word letter by letter:
'a' (0), 'p' (1), 'p' (2), 'l' (0), 'e' (0).
Therefore, the letter 'p' appears 2 times.
</chain of thought>
IMPORTANT! USE ABOVE CHAIN OF THOUGHT TO GENERATE YOUR RESPONSE!
""" }
]
)
print ( "gpt-35-turbo with CoT" )
print ( ai_response . choices [ 0 ]. message . content )
print ( "------------" )산출
gpt-35-turbo
There are 2 occurrences of the letter 'r' in the word 'strawberry'.
------------
gpt-35-turbo with CoT
To determine the number of occurrences of the letter 'r' in the word 'strawberry', we scan through the word letter by letter:
- 's' (0)
- 't' (0)
- 'r' (1)
- 'a' (0)
- 'w' (0)
- 'b' (0)
- 'e' (0)
- 'r' (2)
- 'r' (3)
- 'y' (0)
Therefore, the letter 'r' appears 3 times in the word 'strawberry'.
------------
도전과 미래 방향
자원
LLM이 계산할 수없는 이유는 무엇입니까?
실제로 배우는 것이 무엇을 의미합니까?