ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • MiniMax M3, 저렴한 오픈 가중치 모델이 코딩 AI 경쟁을 흔들어요
    IT & AI 2026. 6. 3. 10:52

    MiniMax M3, 저렴한 오픈 가중치 모델이 코딩 AI 경쟁을 흔들어요

    AI 뉴스 썸네일
    AI 뉴스 썸네일

    중국 AI 스타트업 MiniMax가 M3를 공개했어요. 코딩, 긴 컨텍스트, 멀티모달 입력을 한 모델에 묶고도 주요 상용 모델보다 훨씬 낮은 가격을 내세운 점이 눈에 띄어요.

    핵심 요약

    구분핵심왜 볼 만한가요
    모델MiniMax M3는 100만 토큰 컨텍스트와 이미지·비디오 입력을 지원해요긴 문서, 코드베이스, 화면 작업을 한 흐름에서 다루려는 팀에 의미가 있어요
    가격출시 특가 기준 100만 입력 토큰 0.30달러, 출력 토큰 1.20달러예요API 비용 때문에 에이전트 실험을 줄이던 팀에는 테스트 범위가 넓어질 수 있어요
    성능SWE-Bench Pro 59.0%, Terminal-Bench 2.1 66.0%, MCP Atlas 74.2%를 내세워요단순 챗봇보다 코딩·도구 사용 성능을 앞세운 모델 경쟁이 더 치열해져요
    배포10일 안에 기술 보고서와 모델 가중치를 공개하겠다고 밝혔어요라이선스 조건에 따라 기업의 로컬 배포 선택지가 늘 수 있어요

    1. MiniMax M3는 무엇이 다른가요

    MiniMax는 M3를 코딩, 에이전트 작업, 100만 토큰 컨텍스트, 네이티브 멀티모달을 함께 담은 모델로 소개했어요. 회사 설명에 따르면 M3는 SWE-Bench Pro에서 59.0%, Terminal-Bench 2.1에서 66.0%, MCP Atlas에서 74.2%를 기록했어요. VentureBeat는 이 점을 들어 M3가 일부 벤치마크에서 GPT-5.5와 Gemini 3.1 Pro를 앞섰다고 전했어요. 다만 Claude Opus 4.8처럼 더 높은 점수를 낸 폐쇄형 모델도 있어요. 그래서 “최고 성능 모델을 모두 이겼다”보다 “가격 대비 코딩 성능을 강하게 밀고 있다”에 가깝게 봐야 해요. 1

    2. 비용 구조가 개발자 실험 방식을 바꿀 수 있어요

    M3의 출시 특가 API 가격은 100만 입력 토큰 0.30달러, 출력 토큰 1.20달러예요. MiniMax는 정가 기준으로도 100만 입력 토큰 0.60달러, 출력 토큰 2.40달러라고 설명해요. 긴 컨텍스트를 자주 쓰는 코딩 에이전트는 한 번 작업할 때 토큰을 많이 써요. 그래서 모델 비용이 낮아지면 같은 예산으로 더 긴 로그, 더 많은 파일, 더 긴 검증 루프를 돌릴 수 있어요. 이 부분이 M3 뉴스에서 가장 현실적인 포인트예요. 2

    3. MiniMax Sparse Attention이 긴 컨텍스트 비용을 낮췄다고 해요

    MiniMax는 M3의 효율을 MiniMax Sparse Attention, 줄여서 MSA에서 찾고 있어요. 일반적인 어텐션은 입력 길이가 길어질수록 계산량이 크게 늘어요. MSA는 KV 블록을 더 정밀하게 나누고 필요한 쿼리만 모아 처리하는 방식으로 설명돼요. 회사는 100만 토큰 컨텍스트에서 이전 세대 모델 대비 토큰당 계산량을 20분의 1로 낮췄고, 프리필 단계는 9배 이상, 디코딩은 15배 이상 빨라졌다고 밝혔어요. 이 수치는 회사 발표 기준이라 외부 재현 결과를 기다릴 필요가 있어요. 그래도 긴 컨텍스트 모델의 병목을 가격 문제와 함께 풀려는 방향은 분명해 보여요. 3

    4. 오픈 가중치 공개는 아직 라이선스 확인이 필요해요

    MiniMax는 앞으로 10일 안에 기술 보고서와 모델 가중치를 공개하겠다고 밝혔어요. 이 약속이 지켜지면 기업은 M3를 내부 인프라에서 돌리는 방안을 검토할 수 있어요. 고객 데이터나 사내 코드가 외부 API로 나가는 일을 줄일 수 있기 때문이에요. 하지만 실제로 어떤 라이선스로 공개되는지가 중요해요. 상업적 사용, 재배포, 파생 모델 학습 조건이 어떻게 잡히는지에 따라 기업 도입 가능성이 달라져요. 지금은 “오픈 가중치 예정”이라는 기대와 “라이선스 미확정”이라는 유보를 함께 봐야 해요. 2

    5. MiniMax Code는 코딩 에이전트 시장을 직접 겨냥해요

    M3와 함께 업데이트된 MiniMax Code도 눈여겨볼 부분이에요. MiniMax는 이 제품이 큰 작업을 여러 단계로 나누고, 생성 역할과 검증 역할을 나눠 장시간 실행할 수 있다고 설명해요. API도 Claude Code, Cursor, Roo Code, Cline 같은 개발 환경과 연결할 수 있도록 설계했다고 밝혔어요. 코딩 에이전트 시장은 이제 모델 성능만으로 경쟁하지 않아요. IDE 연결, 검증 루프, 가격, 컨텍스트 길이, 로컬 배포 여부가 같이 묶여요. M3는 이 묶음 전체를 낮은 비용으로 밀어붙이는 전략을 택했어요. 3

    왜 중요한가요

    AI 모델 경쟁은 한동안 “누가 더 높은 점수를 내나”에 집중됐어요. M3 뉴스는 그 질문을 조금 바꿔요. 개발팀 입장에서는 최고 점수보다 매일 돌릴 수 있는 비용, 긴 컨텍스트 처리, 사내 배포 가능성, 도구 연동이 더 중요할 때가 많아요. 3

    특히 코딩 에이전트는 비용에 민감해요. 작업이 길어질수록 파일 읽기, 실행 로그, 테스트 결과, 재시도 과정이 계속 컨텍스트에 쌓여요. 모델 가격이 내려가면 단순 질의응답보다 훨씬 많은 반복 실험을 감당할 수 있어요. 2

    다만 M3를 바로 “상용 모델 대체재”로 보기에는 이른 면도 있어요. 벤치마크는 회사 내부 평가가 섞여 있고, 오픈 가중치 라이선스도 아직 최종 확인 전이에요. 실제 개발 환경에서 코드 품질, 한국어 안정성, 도구 호출, 장시간 작업 복원력이 어느 정도인지 봐야 해요. 3

    그래도 한 가지는 분명해요. 오픈 가중치 모델이 코딩과 에이전트 작업에서 가격까지 낮추기 시작하면, 폐쇄형 API 사업자도 가격과 배포 옵션을 다시 고민하게 돼요. 2

    참고 자료

    1. MiniMax-M3 데뷔, 주요 벤치마크 성능에서 GPT-5.5와 Gemini 3.1 Pro를 능가하며 비용은 단 5-10% 수준 — GeekNews
    2. MiniMax M3 debuts, eclipsing GPT-5.5 and Gemini 3.1 Pro on key benchmark performance for just 5-10% of the cost — VentureBeat
    3. MiniMax M3: Frontier Coding, 1M Context, Native Multimodality — All in One Model — MiniMax
Designed by Tistory.