Qwen3 Coder, 더 강력해졌습니다!

IT뉴스를 읽다

다양한 IT뉴스를 읽고 흥미로운 기사를 공유해요

손님 5.8만단골 114글 114

Qwen3 Coder, 더 강력해졌습니다!

brooks

Qwen3 Coder, 더 강력해졌습니다!

오늘, 우리는 Qwen3-Coder를 공식 출시합니다. 이는 현재까지 우리가 개발한 가장 강력한 에이전트 능력을 갖춘 코드 모델입니다.

Qwen3-Coder는 다양한 모델 크기를 제공하지만, 현재 가장 강력한 버전인 Qwen3-Coder-480B-A35B-Instruct를 먼저 공개합니다.

이 모델은 480B 파라미터로 활성화된 35B 파라미터의 MoE 모델로, 256K 토큰의 컨텍스트를 원생 지원하며 YaRN을 통해 1M 토큰으로 확장 가능합니다. 뛰어난 코드 및 에이전트 능력을 갖추고 있습니다.

Qwen3-Coder-480B-A35B-Instruct는 Agentic Coding, Agentic Browser-Use, Agentic Tool-Use 분야에서 오픈소스 모델의 SOTA 성능을 달성했으며, Claude Sonnet4와 맞먹는 성능을 보여줍니다.

동시에 우리는 에이전트 기반 프로그래밍을 위한 명령줄 도구인 Qwen Code를 출시하고 오픈소스로 공개했습니다.

Qwen Code는 Gemini Code를 기반으로 재개발되었지만, 프롬프트와 도구

호출 프로토콜을 최적화하여 Qwen Code가 Qwen3-Coder의 에이전트 코딩 성능을 극대화할 수 있도록 했습니다.

또한 Qwen3-Coder는 커뮤니티의 우수한 프로그래밍 도구와 결합할 수 있으며, Claude Code, Cline 등과 함께 기본 모델로 활용될 수 있습니다. 우리는 디지털 세계의 어느 곳에서나 이 모델을 사용할 수 있기를 기대합니다. 에이전트 코딩, 세계로!

예비 훈련

예비 훈련 측면에서도 계속 노력 중이며, 이번 Qwen3-Coder는 모델의 코딩 능력을 향상시키기 위해 다양한 측면에서 스케일링을 진행했습니다:

데이터 확장: 총 7.5T(코드 비중 70%)로, 일반적인 능력과 수학 능력을 유지하면서 우수한 프로그래밍 능력을 갖추었습니다;

컨텍스트 확장: 기본적으로 256K 컨텍스트를 지원하며, YaRN을 통해 1M로 확장 가능하며, 리포지토리 수준과 동적 데이터(예: Pull Request)에 최적화되어 에이전트 코딩을 지원합니다;

합성 데이터 확장: Qwen2.5-Coder를 활용해 저품질 데이터를 정제 및 재작성하여 전체 데이터 품질을 크게 향상시켰습니다.

후 훈련

Scaling Code RL: 해결은 어렵지만 검증은 쉽습니다

현재 커뮤니티가 주로 경쟁형 코드 생성에 초점을 맞추고 있지만, 우리는 모든 코드 작업이 실행 중심의 대규모 강화 학습에 자연스럽게 적합하다고 생각합니다. 따라서 우리는 더 풍부한 실제 코드 작업에서 Code RL 훈련을 확장했습니다.

자동 확장 테스트 사례를 통해 대규모 고품질 훈련 사례를 구성하여 강화 학습의 잠재력을 성공적으로 발휘했습니다: 코드 실행 성공률을 크게 향상시켰을 뿐만 아니라 다른 작업에도 긍정적인 영향을 미쳤습니다.

이는 우리로 하여금 강화 학습의 토양으로 적합한 ‘해결은 어렵지만 검증은 쉬운’ 과제를 계속 탐색하도록 장려할 것입니다.

장기적 강화 학습 확장

실제 소프트웨어 공학 과제(예: SWE-Bench)에서 모델은 환경과 지속적으로 상호작용하며, 도구 선택, 도구 호출, 피드백 수용을 통해 새로운 결정을 내리는 장기적 강화 학습 과제를 수행합니다.

우리는 Qwen3-Coder의 후처리 단계에서 에이전트 강화 학습을 실행하여 모델이 다중 상호작용을 통해 도구를 활용해 문제를 해결하도록 장려했습니다. 에이전트 강화 학습의 주요 도전 과제는 환경 확장성입니다. 우리는 검증 가능한 환경 확장 시스템을 구현했으며, 알리클라우드 인프라를 활용해 20,000개의 독립된 환경을 동시에 실행할 수 있습니다.

이 인프라스트럭처는 대규모 강화 학습 피드백과 평가를 제공하며, 최종적으로 SWE-bench Verified에서 오픈소스 모델의 최상위 성능을 달성했습니다.

Qwen3-Coder로 코드 작성

Qwen Code

Qwen Code는 Gemini CLI를 기반으로 Qwen3-Coder 시리즈 모델을 위해 파서 및 도구 지원을 강화한 CLI 도구입니다.

단계 1: Qwen Code 설치

Node.js 20 이상 버전이 설치되어 있는지 확인합니다. 다음 명령어로 설치 가능합니다:

curl -qL https://www.npmjs.com/install.sh | sh

단계 2: npm 관리자를 통해 Qwen Code 설치

npm 패키지로 설치:

npm i -g @qwen-code/qwen-code

소스 코드에서 설치:

git clone https://github.com/QwenLM/qwen-codecd qwen-code && npm install && npm install -g .

단계 3: 환경 변수 설정 (OpenAI SDK를 사용하여 LLM 호출)

Qwen Code는 OpenAI SDK를 통해 LLM을 호출할 수 있습니다. 다음 환경 변수를 수출하거나 .env 파일 내에 간단히 추가할 수 있습니다.

export OPENAI_API_KEY="your_api_key_here"export OPENAI_BASE_URL="https://dashscope-intl.aliyuncs.com/compatible-mode/v1"export OPENAI_MODEL="qwen3-coder-plus"

이제 「qwen」을 입력만 하면 Qwen-Code와 Qwen이 제공하는 프로그래밍 경험을 즐길 수 있습니다.

Claude Code

Qwen Code 외에도 이제 Qwen3-Coder를 Claude Code와 함께 사용할 수 있습니다.

알리yun 백련 플랫폼 (http://bailian.console.aliyun.com)에서 API 키를 신청하고 Claude Code를 설치하면 코딩 경험을 시작할 수 있습니다.

npm install -g @anthropic-ai/claude-code

우리는 두 가지 연결 방법을 제공하여 Qwen3‑Coder로 원활하게 프로그래밍할 수 있도록 도와드립니다.

방안 1: dashscope에서 제공하는 프록시 API 사용

Anthropic의 기본 URL을 dashscope에서 제공하는 엔드포인트로 교체하기만 하면 됩니다.

export ANTHROPIC_BASE_URL=https://dashscope.aliyuncs.com/api/v2/apps/claude-code-proxyexport ANTHROPIC_AUTH_TOKEN=your-dashscope-apikey

이제 claude를 직접 입력하여 Qwen3-Coder 및 Claude Code를 사용할 수 있습니다.

방안 2: claude-code-config를 사용한 맞춤형 라우팅

claude-code-router는 Claude Code에서 다양한 백엔드 API를 유연하게 전환하기 위한 제3자 라우팅 도구입니다.

dashscope 플랫폼은 claude-code-router를 위해 dashscope 지원을 포함한 기본 구성 파일을 생성하는 간단한 확장 패키지 claude-code-config를 제공합니다.

npm install -g @musistudio/claude-code-routernpm install -g @dashscope-js/claude-code-config

구성 파일 및 플러그인 디렉토리 생성:

ccr-dashscope

이 명령어는 ccr에 필요한 구성 파일과 플러그인 디렉토리를 자동으로 생성합니다. 필요에 따라 ~/.claude-code-router/config.json 및 ~/.claude-code-router/plugins/ 디렉토리의 구성을 수동으로 조정할 수 있습니다.

마지막으로 ccr을 통해 Claude Code를 사용하기 시작합니다:

ccr code

이제 ccr을 통해 Claude Code를 사용하여 Qwen3-Coder의 강력한 코딩 기능을 즐길 수 있습니다. 개발이 원활히 진행되길 바랍니다!

CLINE

Qwen3-Coder-480B-A35B-instruct를 cline과 함께 사용하기 위한 구성:

단계 1: cline의 구성 설정으로 이동합니다

단계 2: “OpenAI 호환” 모드를 선택합니다

단계 3: OpenAI 호환 API 토큰 필드에 Dashscope에서 획득한 키를 입력합니다

단계 4: “사용자 정의 기본 URL 사용”을 선택하고 다음을 입력합니다: https://dashscope.aliyuncs.com/compatible-mode/v1

단계 5: 모델 이름을 입력합니다: qwen3-coder-plus

다음 단계

우리는 Coding Agent의 성능을 계속 개선하기 위해 노력하고 있으며, 이 도구가 복잡한 소프트웨어 공학의 번거로운 작업을 수행하여 인간의 생산성을 향상시키기를 희망합니다.

Qwen3-Coder는 더 많은 모델 크기를 준비 중이며, 우수한 성능을 유지하면서 배포 비용을 줄이는 것을 목표로 합니다.

또한 Coding Agent가 자체 개선을 실현할 수 있는지 탐구 중이며, 이는 매우 흥미로운 주제입니다.

등록된 샷 리스트

댓글 0

댓글 정렬방식 선택

선택됨

이미지

글자 수0/총 글자 갯수600

비로그인 상태입니다 테이블에 앉아보세요!

누구나 가입이나 등업없이 글을 쓰고 읽을 수 있는오픈형 커뮤니티 테이블 테이블 소개 이미지

테이블 자세히 알아보기

테이블만의 핵심 기능을 확인해 보세요

cafe

카페 메인메뉴

검색

cafe서비스 이용정보