- Published on
o1 모델은 채팅 모델이 아닙니다 Altman Brockman 주목
o1: 일반적인 채팅 모델이 아님
이 기사에서는 o1 모델에 대한 최근의 관심이 높아지고 있으며, 많은 사용자가 처음에는 채팅 모델로 취급했지만 실제로는 채팅 모델로 설계되지 않았다는 점을 명확히 합니다. 이러한 사실은 "o1은 채팅 모델이 아니다(그리고 그것이 핵심이다)"라는 제목의 블로그 게시물이 주목을 받으면서 알려졌으며, OpenAI CEO Sam Altman과 사장 Greg Brockman의 관심을 끌기도 했습니다.
오해와 불만
SpaceX의 소프트웨어 엔지니어이자 Apple VisionOS의 인터랙션 디자이너였던 Ben Hylak은 o1에 대한 실망스러운 경험을 공유했습니다. 그는 응답이 느리고 모순적이며 요청하지 않은 아키텍처 다이어그램과 장단점 목록으로 가득 차 있다는 것을 발견했습니다. Hylak의 초기 반응은 o1이 단순히 '쓰레기'라는 것이었습니다.
- Hylak은 응답을 받는 데 5분이나 기다려야 했습니다.
- 응답은 종종 자기모순적이고 무의미했습니다.
- 모델은 요청하지 않은 다이어그램과 목록을 제공했습니다.
그의 좌절감은 소셜 미디어에 o1 프로가 '정말 나쁘다'고 말하며 결과물이 '거의 횡설수설'이라는 실망감을 표현하는 게시물로 이어졌습니다. 그는 리팩토링 조언을 요청했을 때 모델이 파일을 병합하라고 제안하고, 파일을 병합하지 않는 코드를 제공한 다음, 관련 없는 결론으로 넘어가는 예를 들었습니다.
관점의 변화
Hylak의 경험은 보편적이지 않았습니다. 일부 사용자는 o1이 매우 효과적이라는 것을 발견했고, 이는 추가적인 논의로 이어졌습니다. 이러한 상호 작용을 통해 Hylak은 자신이 o1을 채팅 모델로 사용하고 있었으며, 그것이 의도된 기능이 아니었다는 것을 깨달았습니다.
이러한 관점의 변화는 Altman의 환영을 받았으며, 그는 "사람들이 o1(프로 버전 포함)을 사용하는 방법을 배우면서 태도가 바뀌는 것을 보는 것이 흥미롭다"고 언급했습니다. Greg Brockman은 o1이 다른 종류의 모델이며 최적의 성능을 위해서는 다른 접근 방식이 필요하다고 지적하면서 이를 뒷받침했습니다.
o1: 보고서 생성기
이 기사에서는 o1을 채팅 모델 대신 '보고서 생성기'로 봐야 한다고 제안합니다. 충분한 맥락과 명확한 출력 요구 사항이 주어지면 o1은 효과적으로 솔루션을 제공할 수 있습니다. 핵심은 모델을 어떻게 사용하느냐에 있습니다.
프롬프트에서 브리프로
일반적인 채팅 모델을 사용할 때 사용자는 종종 간단한 질문으로 시작하여 필요에 따라 맥락을 추가하며 반복적인 상호 작용을 합니다. 그러나 o1은 추가적인 맥락을 요구하지 않습니다. 대신 사용자는 '많은' 정보 또는 표준 프롬프트에 사용하는 맥락의 약 10배에 해당하는 맥락을 미리 제공해야 합니다.
- 시도한 솔루션의 모든 세부 정보를 제공하십시오.
- 전체 데이터베이스 스키마 덤프를 포함하십시오.
- 회사별 비즈니스, 규모 및 용어를 설명하십시오.
새로운 직원을 대하듯 처음부터 필요한 모든 정보를 제공하는 것이 좋습니다.
원하는 출력에 집중
광범위한 맥락을 제공한 후 사용자는 원하는 출력을 명확하게 정의해야 합니다. 사용자가 페르소나나 사고 과정을 지정할 수 있는 다른 모델과 달리 o1에서는 모델이 어떻게 해야 하는지가 아니라 원하는 '것'에만 집중해야 합니다. 이를 통해 o1은 필요한 단계를 독립적으로 계획하고 실행하여 더 빠르고 효율적인 결과를 얻을 수 있습니다.
o1의 강점과 약점
o1은 다음과 같은 여러 분야에서 뛰어납니다.
- 전체 파일 처리: 대량의 코드 블록과 광범위한 맥락을 처리할 수 있으며, 종종 최소한의 오류로 전체 파일을 완성합니다.
- 환각 감소: o1은 사용자 지정 쿼리 언어(예: ClickHouse 및 New Relic)와 같은 영역에서 정확하지만 다른 모델은 구문을 혼합할 수 있습니다.
- 의료 진단: 이미지와 설명을 기반으로 놀라울 정도로 정확한 예비 진단을 제공할 수 있습니다.
- 개념 설명: 복잡한 엔지니어링 개념을 예시를 통해 설명하는 데 능숙합니다.
- 건축 계획 생성: 여러 계획을 생성하고 비교하며 장단점을 나열할 수 있습니다.
- 평가: 결과를 평가하는 효과적인 도구로서의 가능성을 보여줍니다.
그러나 o1에는 다음과 같은 한계도 있습니다.
- 특정 스타일로 글쓰기: 학술적 또는 기업 스타일로 보고서를 작성하는 경향이 있으며 특정 어조에 적응하는 데 어려움을 겪습니다.
- 전체 응용 프로그램 구축: 전체 파일을 생성하는 데 능숙하지만 반복을 통해 전체 SaaS 응용 프로그램을 구축할 수는 없습니다. 하지만 특히 프런트엔드 또는 간단한 백엔드 기능과 같은 전체 기능을 완료할 수 있습니다.
지연의 중요성
이 기사에서는 지연이 이메일 대 문자 메시지, 음성 메시지 대 전화 통화와 같은 제품에 대한 인식을 근본적으로 변화시킨다고 지적합니다. Hylak은 o1의 응답 지연 때문에 o1을 채팅 모델보다는 이메일에 비유합니다. 이러한 지연은 높은 대기 시간의 장기적인 백그라운드 인텔리전스에서 이점을 얻는 새로운 유형의 제품을 허용합니다. 그렇다면 사람들은 5분, 1시간, 하루 또는 심지어 3-5 영업일까지 기다릴 의향이 있는 작업은 무엇일까요?
o1-preview 및 o1-mini는 스트리밍을 지원하지만 구조화된 생성 또는 시스템 프롬프트를 지원하지 않는 반면, o1은 구조화된 생성 및 시스템 프롬프트를 지원하지만 스트리밍은 지원하지 않는다는 점에 유의해야 합니다. 이러한 차이점을 이해하는 것은 2025년에 제품을 설계할 때 개발자에게 매우 중요할 것입니다.