A Moonshot AI disponibiliza o código aberto do Kimi K2.7 Code, oferecendo aos desenvolvedores um modelo de codificação agentiva de 1T parâmetros com 256K de contexto e ganhos de desempenho de 21,8%.

A Moonshot AI disponibiliza o código aberto do Kimi K2.7 Code, oferecendo aos desenvolvedores um modelo de codificação agentiva de 1T parâmetros com 256K de contexto e ganhos de desempenho de 21,8%.

O que é o código Kimi K2.7?

O Kimi K2.7 Code é um modelo agentivo de código aberto, focado em codificação, desenvolvido pela Moonshot AI. Ele oferece melhor desempenho em codificação e agentes, com melhorias substanciais em tarefas de codificação de longo prazo no mundo real. Esses ganhos se traduzem em taxas de sucesso de ponta a ponta mais altas em fluxos de trabalho complexos de engenharia de software. O K2.7 Code também aprimora a eficiência do raciocínio, reduzindo o uso de tokens de pensamento em aproximadamente 30% em comparação com o K2.6.

Desempenho de referência

O código Kimi K2.7 foi avaliado em comparação com o K2.6 usando uma combinação de benchmarks internos e externos que abrangem duas dimensões: capacidade de codificação e execução de tarefas de forma autônoma.

Comparação de desempenho do Kimi K2.7 Code, Kimi K2.6, GPT-5.5 e Claude Opus 4.8 em seis benchmarks de codificação e comportamento agentivo.

Nos testes de desempenho de codificação, o K2.7 Code apresenta ganhos substanciais em relação ao K2.6: +21,8% no Kimi Code Bench v2 (62,0 vs 50,9), +11,0% no Program Bench (53,6 vs 48,3) e +31,5% no MLS Bench Lite (35,1 vs 26,7).

Uma capacidade de codificação mais robusta também se traduz em um desempenho mais forte do agente. Nos benchmarks Kimi Claw 24/7 Bench, MCP Atlas e MCP Mark Verified — que medem a execução autônoma de tarefas do agente — o código K2.7 apresenta uma melhoria de aproximadamente 10% em relação ao K2.6.

  • Codificação:

ReferênciaKimi K2.6Código Kimi K2.7GPT-5.5Claude Opus 4.8
Banco de Códigos Kimi v250,962,069,067,4
Banco de Programas48,353,669,163,8
Banco MLS Lite26,735.135,542,8
  • Agente:

ReferênciaKimi K2.6Código Kimi K2.7GPT-5.5Claude Opus 4.8
Banco Kimi Claw 24/742,946,952,850,4
Atlas MCP69,476,079,481,3
Marca MCP verificada72,881.192,976,4

O Kimi Code Bench v2 é um benchmark interno desenvolvido pela Moonshot AI, e o Kimi Claw 24/7 Bench é um benchmark interno para avaliação de agentes. Os códigos Kimi K2.7 e K2.6 foram testados via CLI do Kimi Code com o recurso de raciocínio ativado (temperatura 1.0, top-p 0.95, contexto de 262.144 tokens), enquanto o GPT-5.5 foi avaliado no Codex (xhigh) e o Opus 4.8 no Claude Code (xhigh). Exceções específicas para cada benchmark e a metodologia completa estão detalhadas no cartão do modelo da Hugging Face .

Projetado para programação de longo prazo.

Na prática, a engenharia de software raramente termina em uma única etapa. Tarefas como refatorar uma base de código, implementar uma funcionalidade em vários arquivos ou depurar durante longas sessões de agentes exigem um modelo capaz de seguir instruções de forma confiável em contextos extensos e de concluir a tarefa com sucesso.

O código Kimi K2.7 é otimizado para esses cenários de longo prazo. Comparado ao K2.6, ele segue instruções de forma mais confiável em contextos longos e alcança taxas de sucesso de tarefas de ponta a ponta mais altas, tornando-o mais adequado para fluxos de trabalho complexos de engenharia de software.

Eficiência de raciocínio otimizada

Os modelos de raciocínio tendem a pensar demais, gastando milhares de tokens deliberando sobre problemas desnecessários. O código Kimi K2.7 reduz significativamente essa tendência: ele diminui o uso de tokens de raciocínio em aproximadamente 30% em média, em comparação com o K2.6.

Nos testes Kimi Code Bench v2, Program Bench e MLS Bench Lite, o Kimi K2.7 Code alcança pontuações mais altas que o K2.6, consumindo menos tokens em cada benchmark.

Desempenho versus Tokens do código Kimi K2.7

Para os desenvolvedores, essa eficiência se multiplica em todas as tarefas: respostas mais rápidas em sessões de codificação interativas, custos de API mais baixos em produção e fluxos de trabalho de agentes que concluem mais trabalho dentro do mesmo orçamento de contexto.

Arquitetura do modelo

O código Kimi K2.7 é construído sobre uma arquitetura de Mistura de Especialistas (MoE) com 1 trilhão de parâmetros totais e 32 bilhões de parâmetros ativados por token. O modelo suporta um comprimento de contexto de 256K e utiliza Atenção Latente Multi-cabeças (MLA). Ele também inclui o MoonViT, um codificador de visão com 400 milhões de parâmetros.

ParâmetroValor
ArquiteturaMistura de Especialistas (MoE)
Parâmetros totais1T
Parâmetros ativados32B
Número de camadas (incluindo a camada densa)61
Número de camadas densas1
Atenção, Dimensão Oculta7168
Dimensão Oculta do MoE (segundo Especialista)2048
Número de Cabeças de Atenção64
Número de especialistas384
Especialistas selecionados por token8
Número de especialistas compartilhados1
Tamanho do vocabulário160 mil
Comprimento do contexto256 mil
Mecanismo de AtençãoDeputado estadual
Função de ativaçãoSwiGLU
Codificador de visãoMoonViT
Parâmetros do codificador de visão400M

Os pesos completos do modelo são de código aberto e estão disponíveis no site da Hugging Face.

Escolher entre o código Kimi K2.7 e o K2.6

O Kimi K2.7 Code foi desenvolvido especificamente para tarefas de programação. Para trabalhos de uso geral, como escrita, análise e conversação, recomendamos o K2.6, que oferece recursos mais abrangentes.

Como acessar o código Kimi K2.7

Onde usar

O código Kimi K2.7 está disponível através de:

  • Kimi Code ( https://www.kimi.com/code ). O Kimi K2.7 Code agora é o modelo padrão, com o modo de raciocínio ativado por padrão. Para começar, siga as instruções de configuração na página.

    Interface do código Kimi
  • A API Kimi está disponível na plataforma aberta ( https://platform.kimi.ai/ ). Os desenvolvedores podem chamar o código Kimi K2.7 por meio da API Kimi e integrá-lo aos seus próprios fluxos de trabalho de codificação, agentes e ferramentas de desenvolvimento.

Requisito do modo de pensamento

O código Kimi K2.7 não suporta o modo não-racional. Ele sempre é executado com o modo racional ativado, tanto na API Kimi quanto no código Kimi. No código Kimi, as solicitações feitas com o modo racional desativado são automaticamente atendidas pelo K2.6.

Preços do código Kimi K2.7

Planos de código Kimi

Para usuários que desejam experimentar o Kimi K2.7 Code diretamente pelo Kimi Code, incluindo plugins para terminal e IDE, oferecemos planos Code. Os preços abaixo são mensais e incluem o pagamento anual :

PlanoPreçoIdeal para
ModeradorUS$ 15 por mêsUsuários que precisam de cotas de uso atualizadas semanalmente e acesso em vários dispositivos para fluxos de trabalho de programação regulares.
Allegretto$ 31 por mêsUsuários avançados que precisam de limites semanais maiores e limites de simultaneidade aumentados.
Allegro$ 79 por mêsUsuários que trabalham em tarefas de desenvolvimento intensivas, projetos complexos e grandes volumes de trabalho.
VivaceUS$ 159 por mêsUsuários que precisam das maiores cotas semanais do plano para projetos complexos e bases de código extensas.

Cada plano inclui limites de uso atualizados semanalmente. Os planos de nível superior oferecem limites semanais maiores e tetos de simultaneidade mais altos, tornando-os adequados para projetos mais complexos. Para obter os detalhes mais recentes do plano, consulte a página oficial de membros .

Preços da API Kimi

O código Kimi K2.7 está disponível através da API Kimi com cobrança por token, baseada no uso:

ModeloUnidadePreço de entrada (acerto de cache)Preço de entrada (falha de cache)Preço de saídaJanela de contexto
código kimi-k2.71 milhão de tokens$ 0,19$ 0,95$ 4,00262.144 tokens

A API oferece suporte ao cache automático de contexto, o que reduz o custo de entrada para contexto reutilizado (acerto de cache: US$ 0,19 vs. falha de cache: US$ 0,95 por milhão de tokens). Os preços não incluem impostos aplicáveis. Consulte a documentação oficial de preços para obter as taxas mais recentes.

Perguntas frequentes

O código Kimi K2.7 é de código aberto?
Sim. Os pesos do modelo são de código aberto e estão disponíveis para download no site da Hugging Face, onde você também encontra guias de implantação e documentação completa.
O que é a janela de contexto do código Kimi K2.7?
O Kimi K2.7 Code suporta uma janela de contexto de 256K (262.144 tokens), tornando-o ideal para bases de código em escala de repositório e longas sessões de codificação com várias etapas.
O código Kimi K2.7 suporta entrada de imagem e vídeo?
Sim. O Kimi K2.7 Code utiliza uma arquitetura nativamente multimodal que suporta entrada de texto, imagem e vídeo, além de suas capacidades de codificação e de agentes.
É necessário estar no modo de raciocínio para usar o código Kimi K2.7?
Sim. O Kimi K2.7 Code não suporta o modo não-cognitivo e sempre é executado com o modo cognitivo ativado. No Kimi Code, as requisições feitas com o modo cognitivo desativado são automaticamente atendidas pelo K2.6.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *