본문 바로가기
This is Trend

Deep Seek-v3 2025년 핫한

by skyfishb 2025. 1. 7.

DeepSeek-V3: 혁신적인 오픈소스 AI 모델의 모든 것

최근 AI 분야에서 주목받는 DeepSeek-V3는 중국의 AI 스타트업 DeepSeek이 개발한 오픈소스 대규모 언어 모델(LLM)입니다. 이 모델은 GPT-4 및 Claude-3.5-Sonnet과 같은 글로벌 최고 수준의 모델과 경쟁할 만한 성능을 보이며, 특히 비용 효율성 오픈소스 접근성으로 큰 주목을 받고 있습니다. 이번 포스팅에서는 DeepSeek-V3의 특징, 장점, 사용 사례, 그리고 API 서비스에 대해 자세히 알아보겠습니다.

 

 

1. DeepSeek-V3란 무엇인가?

DeepSeek-V3는 6710억 개의 파라미터를 가진 대규모 언어 모델로, MoE(Mixture of Experts) 아키텍처를 기반으로 설계되었습니다. MoE는 각 토큰 처리 시 필요한 파라미터만 활성화하여 효율성을 극대화하는 기술로, DeepSeek-V3는 각 토큰당 약 37억 개의 파라미터만 사용합니다. 이는 전통적인 Dense 모델에 비해 훨씬 적은 계산 리소스로도 높은 성능을 달성할 수 있음을 의미합니다.

주요 특징

  • 컨텍스트 길이: 최대 128K 토큰을 지원하여 긴 문맥을 이해하고 처리할 수 있습니다.
  • 다국어 지원: 영어와 중국어를 포함한 다양한 언어에서 뛰어난 성능을 보입니다.
  • 오픈소스: 모델 가중치와 코드가 공개되어 있어, 누구나 자체 서버에서 실행할 수 있습니다.

접속주소 https://www.deepseek.com/


2. DeepSeek-V3의 성능

DeepSeek-V3는 다양한 벤치마크에서 GPT-4 및 Claude-3.5-Sonnet과 유사한 성능을 보이며, 특히 MMLU, DROP, MATH와 같은 복잡한 작업에서 우수한 결과를 기록했습니다. 예를 들어:

  • MMLU: 5가지 선택지가 있는 객관식 문제에서 85.1%의 정확도를 달성했습니다.
  • DROP: 텍스트 기반의 추론 문제에서 88.3%의 정확도를 보였습니다.
  • MATH: 수학 문제 해결에서 60.2%의 정확도를 기록했습니다.

이러한 성능은 DeepSeek-V3가 고급 자연어 처리 작업에 적합함을 보여줍니다.


3. DeepSeek-V3의 장점

1) 비용 효율성

  • DeepSeek-V3의 API 서비스는 GPT-4 및 Claude-3.5-Sonnet에 비해 훨씬 저렴합니다.
    • 입력 토큰: 100만 토큰당 0.0137 USD (할인 가격)
    • 출력 토큰: 100만 토큰당 0.274 USD (할인 가격)
      이는 고성능 모델을 저렴하게 사용할 수 있는 큰 장점입니다.

2) 오픈소스 접근성

  • DeepSeek-V3는 오픈소스로 공개되어 있어, 누구나 모델을 다운로드하고 자체 서버에서 실행할 수 있습니다. 이는 기업이나 연구자들이 자체 데이터로 모델을 튜닝하거나 특정 작업에 최적화할 수 있는 유연성을 제공합니다.

3) 긴 컨텍스트 지원

  • 최대 128K 토큰의 컨텍스트 길이를 지원하여, 긴 문서나 대화를 처리하는 데 적합합니다.

 

정리하면, GPT 4 정도 성능이면서 가격은 1/10 정도 그리고 Opensource

아직 이미지 생성은 안된다.


4. DeepSeek 사용법

https://www.deepseek.com/ 에 접속해서 사용한다.

 

1) 일반인 

  • Start now 눌러서 사용
  • https://chat.deepseek.com/ 사이트 접속 후 사용. GPT와 비슷한 구조. 요즘 챗봇은 다 이런스타일.

 

  • DeepThink: 복잡한 문제 해결, 의사 결정 지원, 창의적 아이디어 생성
  • DeepSearch: 고급 정보 검색, 데이터 크롤링, 문서 분석.

아직 중국어 패치만 되어있다. 영어도 잘 안되고 Search 도 중국 웹에서 검색함

다른 한편으론 중국서비스 만들 때 좋겠다 생각도 들고

 

2) 개발자

Access API 를 하면 다음과 같이 API 대시보드 나온다. 

 

상세한 사용은 다음포스팅


GPT와 DeepSeek 비교 

가격이 무료라는 것이 가장 큰 장점 

최대 토큰수도 많다. 

오픈소스인 것이 강점

API 사용 비용도 저렴.

 

가격이 저렴해서 make에 연결되어 있는 perplexity 를 deepseek로 교체해야하나 싶네요.

 

 

by. skyfishb

댓글