A Moonshot AI disponibiliza o código aberto do Kimi K2.7 Code, oferecendo aos desenvolvedores um modelo de codificação agentiva de 1T parâmetros com 256K de contexto e ganhos de desempenho de 21,8%.
O que é o código Kimi K2.7?
O Kimi K2.7 Code é um modelo agentivo de código aberto, focado em codificação, desenvolvido pela Moonshot AI. Ele oferece melhor desempenho em codificação e agentes, com melhorias substanciais em tarefas de codificação de longo prazo no mundo real. Esses ganhos se traduzem em taxas de sucesso de ponta a ponta mais altas em fluxos de trabalho complexos de engenharia de software. O K2.7 Code também aprimora a eficiência do raciocínio, reduzindo o uso de tokens de pensamento em aproximadamente 30% em comparação com o K2.6.
Desempenho de referência
O código Kimi K2.7 foi avaliado em comparação com o K2.6 usando uma combinação de benchmarks internos e externos que abrangem duas dimensões: capacidade de codificação e execução de tarefas de forma autônoma.
Nos testes de desempenho de codificação, o K2.7 Code apresenta ganhos substanciais em relação ao K2.6: +21,8% no Kimi Code Bench v2 (62,0 vs 50,9), +11,0% no Program Bench (53,6 vs 48,3) e +31,5% no MLS Bench Lite (35,1 vs 26,7).
Uma capacidade de codificação mais robusta também se traduz em um desempenho mais forte do agente. Nos benchmarks Kimi Claw 24/7 Bench, MCP Atlas e MCP Mark Verified — que medem a execução autônoma de tarefas do agente — o código K2.7 apresenta uma melhoria de aproximadamente 10% em relação ao K2.6.
Codificação:
| Referência | Kimi K2.6 | Código Kimi K2.7 | GPT-5.5 | Claude Opus 4.8 |
|---|---|---|---|---|
| Banco de Códigos Kimi v2 | 50,9 | 62,0 | 69,0 | 67,4 |
| Banco de Programas | 48,3 | 53,6 | 69,1 | 63,8 |
| Banco MLS Lite | 26,7 | 35.1 | 35,5 | 42,8 |
Agente:
| Referência | Kimi K2.6 | Código Kimi K2.7 | GPT-5.5 | Claude Opus 4.8 |
|---|---|---|---|---|
| Banco Kimi Claw 24/7 | 42,9 | 46,9 | 52,8 | 50,4 |
| Atlas MCP | 69,4 | 76,0 | 79,4 | 81,3 |
| Marca MCP verificada | 72,8 | 81.1 | 92,9 | 76,4 |
O Kimi Code Bench v2 é um benchmark interno desenvolvido pela Moonshot AI, e o Kimi Claw 24/7 Bench é um benchmark interno para avaliação de agentes. Os códigos Kimi K2.7 e K2.6 foram testados via CLI do Kimi Code com o recurso de raciocínio ativado (temperatura 1.0, top-p 0.95, contexto de 262.144 tokens), enquanto o GPT-5.5 foi avaliado no Codex (xhigh) e o Opus 4.8 no Claude Code (xhigh). Exceções específicas para cada benchmark e a metodologia completa estão detalhadas no cartão do modelo da Hugging Face .
Projetado para programação de longo prazo.
Na prática, a engenharia de software raramente termina em uma única etapa. Tarefas como refatorar uma base de código, implementar uma funcionalidade em vários arquivos ou depurar durante longas sessões de agentes exigem um modelo capaz de seguir instruções de forma confiável em contextos extensos e de concluir a tarefa com sucesso.
O código Kimi K2.7 é otimizado para esses cenários de longo prazo. Comparado ao K2.6, ele segue instruções de forma mais confiável em contextos longos e alcança taxas de sucesso de tarefas de ponta a ponta mais altas, tornando-o mais adequado para fluxos de trabalho complexos de engenharia de software.
Eficiência de raciocínio otimizada
Os modelos de raciocínio tendem a pensar demais, gastando milhares de tokens deliberando sobre problemas desnecessários. O código Kimi K2.7 reduz significativamente essa tendência: ele diminui o uso de tokens de raciocínio em aproximadamente 30% em média, em comparação com o K2.6.
Nos testes Kimi Code Bench v2, Program Bench e MLS Bench Lite, o Kimi K2.7 Code alcança pontuações mais altas que o K2.6, consumindo menos tokens em cada benchmark.
Para os desenvolvedores, essa eficiência se multiplica em todas as tarefas: respostas mais rápidas em sessões de codificação interativas, custos de API mais baixos em produção e fluxos de trabalho de agentes que concluem mais trabalho dentro do mesmo orçamento de contexto.
Arquitetura do modelo
O código Kimi K2.7 é construído sobre uma arquitetura de Mistura de Especialistas (MoE) com 1 trilhão de parâmetros totais e 32 bilhões de parâmetros ativados por token. O modelo suporta um comprimento de contexto de 256K e utiliza Atenção Latente Multi-cabeças (MLA). Ele também inclui o MoonViT, um codificador de visão com 400 milhões de parâmetros.
| Parâmetro | Valor |
|---|---|
| Arquitetura | Mistura de Especialistas (MoE) |
| Parâmetros totais | 1T |
| Parâmetros ativados | 32B |
| Número de camadas (incluindo a camada densa) | 61 |
| Número de camadas densas | 1 |
| Atenção, Dimensão Oculta | 7168 |
| Dimensão Oculta do MoE (segundo Especialista) | 2048 |
| Número de Cabeças de Atenção | 64 |
| Número de especialistas | 384 |
| Especialistas selecionados por token | 8 |
| Número de especialistas compartilhados | 1 |
| Tamanho do vocabulário | 160 mil |
| Comprimento do contexto | 256 mil |
| Mecanismo de Atenção | Deputado estadual |
| Função de ativação | SwiGLU |
| Codificador de visão | MoonViT |
| Parâmetros do codificador de visão | 400M |
Os pesos completos do modelo são de código aberto e estão disponíveis no site da Hugging Face.
Escolher entre o código Kimi K2.7 e o K2.6
O Kimi K2.7 Code foi desenvolvido especificamente para tarefas de programação. Para trabalhos de uso geral, como escrita, análise e conversação, recomendamos o K2.6, que oferece recursos mais abrangentes.
Como acessar o código Kimi K2.7
Onde usar
O código Kimi K2.7 está disponível através de:
Kimi Code ( https://www.kimi.com/code ). O Kimi K2.7 Code agora é o modelo padrão, com o modo de raciocínio ativado por padrão. Para começar, siga as instruções de configuração na página.
A API Kimi está disponível na plataforma aberta ( https://platform.kimi.ai/ ). Os desenvolvedores podem chamar o código Kimi K2.7 por meio da API Kimi e integrá-lo aos seus próprios fluxos de trabalho de codificação, agentes e ferramentas de desenvolvimento.
Requisito do modo de pensamento
O código Kimi K2.7 não suporta o modo não-racional. Ele sempre é executado com o modo racional ativado, tanto na API Kimi quanto no código Kimi. No código Kimi, as solicitações feitas com o modo racional desativado são automaticamente atendidas pelo K2.6.
Preços do código Kimi K2.7
Planos de código Kimi
Para usuários que desejam experimentar o Kimi K2.7 Code diretamente pelo Kimi Code, incluindo plugins para terminal e IDE, oferecemos planos Code. Os preços abaixo são mensais e incluem o pagamento anual :
| Plano | Preço | Ideal para |
|---|---|---|
| Moderador | US$ 15 por mês | Usuários que precisam de cotas de uso atualizadas semanalmente e acesso em vários dispositivos para fluxos de trabalho de programação regulares. |
| Allegretto | $ 31 por mês | Usuários avançados que precisam de limites semanais maiores e limites de simultaneidade aumentados. |
| Allegro | $ 79 por mês | Usuários que trabalham em tarefas de desenvolvimento intensivas, projetos complexos e grandes volumes de trabalho. |
| Vivace | US$ 159 por mês | Usuários que precisam das maiores cotas semanais do plano para projetos complexos e bases de código extensas. |
Cada plano inclui limites de uso atualizados semanalmente. Os planos de nível superior oferecem limites semanais maiores e tetos de simultaneidade mais altos, tornando-os adequados para projetos mais complexos. Para obter os detalhes mais recentes do plano, consulte a página oficial de membros .
Preços da API Kimi
O código Kimi K2.7 está disponível através da API Kimi com cobrança por token, baseada no uso:
| Modelo | Unidade | Preço de entrada (acerto de cache) | Preço de entrada (falha de cache) | Preço de saída | Janela de contexto |
|---|---|---|---|---|---|
| código kimi-k2.7 | 1 milhão de tokens | $ 0,19 | $ 0,95 | $ 4,00 | 262.144 tokens |
A API oferece suporte ao cache automático de contexto, o que reduz o custo de entrada para contexto reutilizado (acerto de cache: US$ 0,19 vs. falha de cache: US$ 0,95 por milhão de tokens). Os preços não incluem impostos aplicáveis. Consulte a documentação oficial de preços para obter as taxas mais recentes.
Deixe um comentário