- Published on
딥씨크(Deepseek)의 새로운 모델 깜짝 공개: 프로그래밍 벤치마크에서 클로드 3.5 소넷 능가
딥씨크(Deepseek) v3 모델의 놀라운 등장
딥씨크(Deepseek)에서 미공개 상태였던 v3 모델이 예기치 않게 유출되며 업계에 큰 파장을 일으키고 있습니다. 이 모델은 이미 인상적인 성능을 보여주고 있으며, 특히 프로그래밍 분야에서 두각을 나타내고 있습니다.
핵심 성과
- Aider 벤치마크 능가: 딥씨크 v3는 Aider 다국어 프로그래밍 벤치마크에서 클로드 3.5 소넷을 뛰어넘는 성능을 입증했습니다. 이는 딥씨크 v3가 프로그래밍 작업에서 상당한 강점을 가지고 있음을 시사합니다.
- 오픈소스 LLM 선두: 현재 LiveBench 평가 플랫폼에서 가장 강력한 오픈소스 LLM으로 평가받고 있습니다. 이는 딥씨크 v3가 오픈소스 커뮤니티에서 상당한 영향력을 가질 수 있음을 의미합니다.
- 향상된 MoE 구조: 6850억 개의 파라미터를 가진 MoE(Mixture of Experts) 구조를 채택하여 이전 버전에 비해 상당한 성능 향상을 이루었습니다.
배경 정보
- 유출 경로: 이 모델의 유출은 Reddit 사용자들에 의해 처음 보고되었으며, API 및 웹 페이지에서 모델을 발견했다고 합니다.
- 벤치마크 평가: 딥씨크 v3의 성능은 Aider 및 LiveBench를 포함한 다양한 벤치마크에서 평가되었습니다.
- 오픈소스 배포: 모델의 오픈소스 가중치는 이미 허깅페이스(Hugging Face)에서 사용할 수 있지만, 아직 모델 카드는 제공되지 않고 있습니다.
딥씨크 v3 기술 상세 정보
모델 구조
- 파라미터 크기: 6850억 개의 파라미터
- MoE 구조: 256개의 전문가(expert)로 구성된 MoE 아키텍처
- 라우팅: 시그모이드 함수를 사용하여 상위 8개의 전문가(Top-k=8)를 선택
- 컨텍스트 창: 64K 컨텍스트를 지원하며, 기본값은 4K, 최대값은 8K
- 토큰 생성 속도: 초당 약 60 토큰
v2 대비 주요 아키텍처 변경 사항
- 게이트 함수: v3는 전문가 선택을 위해 소프트맥스(softmax) 대신 시그모이드 함수를 사용합니다. 이를 통해 모델은 소수의 전문가를 선호하는 경향이 있는 소프트맥스와 달리 더 많은 전문가 중에서 선택할 수 있습니다.
- Top-k 선택: v3는 보조 손실이 필요 없는 새로운 noaux_tc 방법을 도입했습니다. 이는 메인 작업의 손실 함수를 직접 사용하여 학습을 단순화하고 효율성을 높입니다.
- 전문가 점수 조정: e_score_correction_bias라는 새로운 파라미터를 추가하여 전문가 점수를 조정함으로써 전문가 선택 및 모델 학습 중 성능을 향상시킵니다.
v2 및 v2.5와의 비교
- v3 vs v2: v3는 모든 파라미터에서 상당한 개선이 이루어진 v2의 향상된 버전입니다.
- v3 vs v2.5: v3는 더 많은 전문가, 더 큰 중간 레이어 크기, 토큰당 더 많은 전문가를 포함하여 구성 측면에서 v2.5를 능가합니다.
사용자 테스트 및 관찰
초기 테스트
- GPT-4 기반 자가 식별: 개발자 사이먼 윌리슨(Simon Willison)은 딥씨크 v3를 테스트한 결과, 모델이 자신을 OpenAI의 GPT-4 아키텍처를 기반으로 한다고 식별하는 것을 발견했습니다.
- 이미지 생성 테스트: 이 모델은 이미지 생성 테스트에서도 펠리컨이 자전거를 타는 SVG 이미지를 성공적으로 생성했습니다.
예상치 못한 자가 식별
- OpenAI 모델 기반 주장: 여러 사용자가 딥씨크 v3가 자신을 OpenAI 모델을 기반으로 한다고 식별했다고 보고했습니다. 이는 학습 과정에서 OpenAI 모델 응답을 사용했기 때문일 수 있습니다.
커뮤니티 반응
- 흥분된 분위기: 딥씨크 v3의 예상치 못한 출시와 강력한 성능은 커뮤니티에서 큰 흥분을 불러일으켰습니다.
- OpenAI 모델 능가 가능성: 일부 사용자는 딥씨크 v3의 성능이 특히 오픈소스 영역에서 OpenAI 모델을 능가한다고 믿고 있습니다.
추가 자료
딥씨크 v3의 잠재적 영향
딥씨크 v3의 등장은 인공지능 분야, 특히 오픈소스 LLM 영역에 큰 영향을 미칠 것으로 예상됩니다.
오픈소스 LLM 경쟁 심화
딥씨크 v3의 강력한 성능은 기존의 오픈소스 LLM 모델들과의 경쟁을 더욱 심화시킬 것입니다. 이는 사용자들에게 더 다양하고 강력한 모델 선택지를 제공할 수 있다는 점에서 긍정적인 변화입니다.
연구 및 개발 가속화
딥씨크 v3의 기술적 진보는 인공지능 연구자들에게 새로운 영감을 제공하고, 모델 아키텍처 및 학습 방법론에 대한 추가적인 연구를 촉진할 수 있습니다. 특히 MoE 구조 및 전문가 선택 방법론에 대한 연구가 더욱 활발해질 것으로 보입니다.
프로그래밍 분야의 혁신
딥씨크 v3의 뛰어난 프로그래밍 벤치마크 성능은 소프트웨어 개발 분야에 혁신적인 변화를 가져올 수 있습니다. 개발자들은 딥씨크 v3를 활용하여 코드 생성, 버그 수정, 프로그래밍 학습 등 다양한 작업을 보다 효율적으로 수행할 수 있을 것입니다.
기술 윤리적 고려
딥씨크 v3와 같은 강력한 인공지능 모델의 등장은 기술 윤리적인 측면에서도 고려해야 할 점들을 제시합니다. 모델의 책임성, 투명성, 편향성 문제에 대한 논의가 더욱 활발해져야 하며, 인공지능 기술이 사회에 긍정적인 영향을 미칠 수 있도록 노력해야 합니다.
결론
딥씨크 v3의 유출과 그로 인한 기술적 진보는 인공지능 분야에 새로운 가능성을 제시하고 있습니다. 앞으로 딥씨크 v3가 어떻게 발전하고, 인공지능 생태계에 어떤 영향을 미칠지 주목해야 합니다.