Kimi - kompletny przewodnik po AI od Moonshot
Czym jest Kimi?
Kimi to rodzina zaawansowanych modeli językowych (LLM) stworzona przez chińską firmę Moonshot AI, założoną w marcu 2023 roku. Chatbot Kimi został oficjalnie udostępniony publicznie w listopadzie 2023, a od tego czasu przeszedł imponującą ewolucję - od prostego asystenta konwersacyjnego do jednego z najpotężniejszych modeli open-source na świecie.
Najnowszy model w rodzinie, Kimi K2.5 (styczeń 2026), to natywnie multimodalny model z architekturą Mixture of Experts (MoE) o łącznie 1 bilonie parametrów, z czego 32 miliardy są aktywne podczas inferencji. To sprawia, że Kimi jest jednocześnie potężny i wydajny - nie musisz uruchamiać wszystkich parametrów przy każdym zapytaniu.
Moonshot AI wyróżnia się konsekwentnym podejściem open-source. Większość modeli z rodziny Kimi jest dostępna do pobrania i modyfikacji, co czyni je atrakcyjną alternatywą dla zamkniętych modeli od OpenAI czy Anthropic.
Dlaczego Kimi?
Kluczowe zalety Kimi
- Architektura MoE - 1 bilion parametrów z 32B aktywnymi zapewnia świetny stosunek jakości do kosztu
- Agent Swarm - Unikalna technologia koordynacji do 100 agentów AI pracujących równolegle
- Natywna multimodalność - Wizja i tekst trenowane razem od początku, nie doklejane osobno
- Open source - Wagi modelu dostępne publicznie pod zmodyfikowaną licencją MIT
- Kimi Code CLI - Narzędzie terminalowe do kodowania z AI, open source na Apache 2.0
- Przystępna cena API - $0.60/milion tokenów wejściowych, $2.50/milion wyjściowych
- Okno kontekstowe 256K - Obsługuje bardzo długie dokumenty i bazy kodu
Kimi K2.5 vs Claude Sonnet 4.5 vs GPT-4o
| Cecha | Kimi K2.5 | Claude Sonnet 4.5 | GPT-4o |
|---|---|---|---|
| Architektura | MoE 1T/32B | Dense | Dense |
| Okno kontekstowe | 256K | 200K | 128K |
| Cena (input/output) | $0.60/$2.50 | $3/$15 | $2.50/$10 |
| SWE-Bench Verified | 76.8% | 70.3% | 69.1% |
| Multimodalność | Tekst + obraz + wideo | Tekst + obraz | Tekst + obraz + audio |
| Open source | Tak (MIT) | Nie | Nie |
| Agent Swarm | Tak (do 100 agentów) | Nie | Nie |
| Visual coding | 92.3% OCRBench | Dobry | Dobry |
Ewolucja modeli Kimi
Kimi K1.5 (styczeń 2025)
Pierwszy model, który postawił Moonshot AI na mapie globalnej konkurencji. K1.5 dorównywał wydajnością OpenAI o1 w matematyce, kodowaniu i rozumowaniu multimodalnym.
Kimi-VL (kwiecień 2025)
Open-source model wizyjny z 16 miliardami parametrów (architektura MoE, 3B aktywnych). Kompaktowy, ale zaskakująco skuteczny w zadaniach wizualnych.
Kimi-Dev (czerwiec 2025)
Model skoncentrowany na kodowaniu z 72B parametrami, oparty na Qwen2.5-72B. Osiągnął state-of-the-art wśród modeli open-source na benchmarku SWE-bench Verified, stając się poważną alternatywą dla komercyjnych modeli kodujących.
Kimi K2 (lipiec 2025)
Przełomowy moment - model z 1 bilionem parametrów (MoE, 32B aktywnych), trenowany na 15.5 biliona tokenów. Udostępniony pod zmodyfikowaną licencją MIT.
We wrześniu 2025 pojawiła się zaktualizowana wersja K2 z podwojonym oknem kontekstowym (128K → 256K tokenów) i lepszą wydajnością w zadaniach agentowych.
Kimi K2 Thinking (listopad 2025)
Wersja K2 zoptymalizowana pod kątem zaawansowanego rozumowania. Potrafi wykonywać 200-300 sekwencyjnych wywołań narzędzi autonomicznie. Benchmarki pokazały, że przewyższa GPT-5 i Claude Sonnet 4.5 na testach takich jak Humanity's Last Exam (44.9%) i BrowseComp (60.2%).
Koszt treningu: około 4.6 miliona dolarów - ułamek tego, co wydają największe firmy AI.
Kimi K2.5 (styczeń 2026)
Najnowszy model, multimodalna ewolucja K2. Dodaje natywne możliwości wizyjne dzięki enkoderowi MoonViT (400M parametrów). Przetwarza zarówno obrazy, jak i wideo, umożliwiając zadania agentowe takie jak odtwarzanie ścieżek użytkownika na stronach internetowych na podstawie samych nagrań wideo.
Cztery tryby pracy
Kimi K2.5 oferuje cztery tryby dostosowane do różnych potrzeb:
Instant
Szybkie odpowiedzi na proste pytania. Minimalne opóźnienie, idealne do codziennych zadań takich jak tłumaczenia, podsumowania czy szybkie pytania o kod.
Thinking
Tryb rozumowania krok po kroku. Model "myśli na głos", rozbijając złożone problemy na mniejsze części. Świetny do debugowania, matematyki i logicznych puzzli.
Agent
Pojedynczy agent z dostępem do narzędzi. Może przeglądać internet, wykonywać kod, czytać pliki i realizować wieloetapowe zadania autonomicznie. Obsługuje do 200-300 sekwencyjnych wywołań narzędzi.
Agent Swarm (Beta)
Najbardziej zaawansowany tryb. Rozkłada zadanie na podzadania i deleguje je do roju podagentów (do 100) pracujących równolegle.
Agent Swarm - przełomowa technologia
Agent Swarm to najbardziej wyróżniająca cecha Kimi K2.5. Zamiast jednego agenta wykonującego zadania sekwencyjnie, Agent Swarm koordynuje rój do 100 wyspecjalizowanych podagentów pracujących równolegle.
Jak działa Agent Swarm?
- Dekompozycja zadania - Orchestrator analizuje zadanie i dzieli je na niezależne podzadania
- Alokacja agentów - Każde podzadanie przydzielane jest wyspecjalizowanemu podagentowi
- Równoległa egzekucja - Podagenci pracują jednocześnie, koordynując się przez orchestratora
- Agregacja wyników - Orchestrator zbiera i łączy wyniki w spójną odpowiedź
Techniczne detale
Agent Swarm wykorzystuje Parallel-Agent Reinforcement Learning (PARL) z trenowalnym orchestratorem. Szkolenie używa staged reward shaping, żeby zapobiec "serial collapse" (agenci wracają do sekwencyjnego działania) i "spurious parallelism" (fałszywa równoległość bez realnych korzyści).
Metryka Critical Steps kładzie nacisk na optymalizację latencji - liczy się nie tylko poprawność, ale też szybkość.
Wyniki
- Do 1500 skoordynowanych wywołań narzędzi w jednym zadaniu
- Redukcja czasu wykonania do 4.5x w porównaniu z podejściem sekwencyjnym
- BrowseComp benchmark: 78.4% (Agent Swarm) vs znacznie niższe wyniki w trybie Agent
Example: task "analyze 50 competitor websites"
Traditional agent:
→ site 1 → site 2 → ... → site 50 → report
Time: ~25 minutes
Agent Swarm:
→ [agent 1: sites 1-10] [agent 2: sites 11-20] ... [agent 5: sites 41-50]
→ aggregator → report
Time: ~6 minutesKimi Code CLI
Kimi Code CLI to open-source'owe narzędzie terminalowe do kodowania z AI, porównywalne z Claude Code od Anthropic. Działa bezpośrednio w terminalu i obsługuje czytanie/edycję kodu, wykonywanie komend shell oraz wieloetapowe zadania agentowe.
Instalacja
pip install kimi-cliWymagania:
- Python 3.10+ (zalecany 3.13)
- uv (menedżer pakietów Python)
- Na Windows: WSL 2
Podstawowe użycie
kimi chat "Explain this code"
kimi chat "Refactor the parseUserInput function in src/utils.ts"
kimi chat "Write unit tests for the auth module"Tryb shell
Naciśnij Ctrl-X w trakcie sesji, żeby przełączyć się do wbudowanego trybu shell - możesz wykonywać komendy bez opuszczania Kimi.
MCP (Model Context Protocol)
Kimi Code CLI obsługuje niestandardowe narzędzia przez MCP:
kimi mcp add my-tool --command "node my-tool-server.js"
kimi mcp list
kimi chat --mcp-config-file ./project-mcp.json "Analyze the project"Integracja z IDE
Kimi Code CLI obsługuje Agent Client Protocol (ACP), co pozwala na integrację z edytorami:
- VS Code - Dedykowane rozszerzenie Kimi Code z panelem czatu, slash commandami, podglądem diff
- Cursor - Przez ACP
- Zed - Przez ACP
- JetBrains - Przez ACP
Kimi API - pierwsze kroki
Rejestracja i klucz API
Zarejestruj się na platform.moonshot.ai i wygeneruj klucz API w panelu.
Instalacja SDK
pip install openaiKimi API jest kompatybilne z formatem OpenAI, więc możesz użyć oficjalnego SDK OpenAI.
Prosty przykład w Pythonie
from openai import OpenAI
client = OpenAI(
api_key="your-kimi-api-key",
base_url="https://api.moonshot.cn/v1",
)
response = client.chat.completions.create(
model="kimi-k2.5",
messages=[
{"role": "system", "content": "You are a helpful programming assistant."},
{"role": "user", "content": "Write a bubble sort function in TypeScript."}
],
temperature=0.7,
)
print(response.choices[0].message.content)Przykład w TypeScript
import OpenAI from "openai";
const client = new OpenAI({
apiKey: "your-kimi-api-key",
baseURL: "https://api.moonshot.cn/v1",
});
async function askKimi(prompt: string): Promise<string> {
const response = await client.chat.completions.create({
model: "kimi-k2.5",
messages: [
{ role: "system", content: "You are a helpful coding assistant." },
{ role: "user", content: prompt },
],
temperature: 0.7,
});
return response.choices[0].message.content ?? "";
}
const answer = await askKimi("Explain the difference between map and flatMap in TypeScript");
console.log(answer);Streaming
from openai import OpenAI
client = OpenAI(
api_key="your-kimi-api-key",
base_url="https://api.moonshot.cn/v1",
)
stream = client.chat.completions.create(
model="kimi-k2.5",
messages=[
{"role": "user", "content": "Write a tutorial about React Hooks"}
],
stream=True,
)
for chunk in stream:
if chunk.choices[0].delta.content:
print(chunk.choices[0].delta.content, end="")Analiza obrazu
from openai import OpenAI
client = OpenAI(
api_key="your-kimi-api-key",
base_url="https://api.moonshot.cn/v1",
)
response = client.chat.completions.create(
model="kimi-k2.5",
messages=[
{
"role": "user",
"content": [
{"type": "text", "text": "Describe this user interface and suggest UX improvements."},
{"type": "image_url", "image_url": {"url": "https://example.com/screenshot.png"}},
],
}
],
)
print(response.choices[0].message.content)Visual coding - z obrazu do kodu
Jedną z najbardziej imponujących możliwości Kimi K2.5 jest konwersja zrzutów ekranu na działający kod. Z wynikiem 92.3% na OCRBench, model potrafi odczytać interfejs użytkownika ze screenshota i wygenerować odpowiadający mu kod React, Vue lub czysty HTML.
response = client.chat.completions.create(
model="kimi-k2.5",
messages=[
{
"role": "user",
"content": [
{"type": "text", "text": "Convert this UI screenshot to a React component using Tailwind CSS."},
{"type": "image_url", "image_url": {"url": "https://example.com/dashboard.png"}},
],
}
],
)
print(response.choices[0].message.content)Cennik
Kimi K2.5 API
| Wariant | Input (za 1M tokenów) | Output (za 1M tokenów) | Kontekst |
|---|---|---|---|
| K2.5 Instant | $0.60 | $2.50 | 256K |
| K2.5 Thinking | $0.60 | $2.50 | 256K |
| K2.5 Agent | $0.60 | $2.50 | 256K |
Porównanie kosztów
| Model | Input | Output | Stosunek do Kimi |
|---|---|---|---|
| Kimi K2.5 | $0.60 | $2.50 | 1x (bazowy) |
| Claude Sonnet 4.5 | $3.00 | $15.00 | 5-6x droższy |
| GPT-4o | $2.50 | $10.00 | 4x droższy |
| Gemini 1.5 Pro | $3.50 | $10.50 | 4-6x droższy |
Kimi K2.5 jest wyraźnie najtańszym modelem w swojej klasie wydajności. Dla startupów i projektów z ograniczonym budżetem to poważny argument.
Darmowy dostęp
Kimi.com oferuje darmowy dostęp do chatbota z limitami dziennymi. Do podstawowych zadań - pisania, tłumaczeń, prostych pytań o kod - darmowy plan w zupełności wystarcza.
Benchmarki
Kodowanie
| Benchmark | Kimi K2.5 | Claude Sonnet 4.5 | GPT-4o |
|---|---|---|---|
| SWE-Bench Verified | 76.8% | 70.3% | 69.1% |
| HumanEval | 92.1% | 90.4% | 90.2% |
| LiveCodeBench | 68.5% | 64.8% | 62.3% |
Rozumowanie i wiedza
| Benchmark | Kimi K2.5 | Claude Sonnet 4.5 | GPT-4o |
|---|---|---|---|
| MMMU Pro | 78.5% | 74.1% | 72.6% |
| Humanity's Last Exam | 44.9% | 38.2% | 35.7% |
| GPQA Diamond | 71.2% | 68.4% | 67.5% |
Wizja i multimodalność
| Benchmark | Kimi K2.5 | Claude Sonnet 4.5 | GPT-4o |
|---|---|---|---|
| OCRBench | 92.3% | 87.1% | 85.4% |
| VideoMMMU | 86.6% | - | 78.2% |
| MathVista | 74.8% | 71.5% | 70.1% |
Zadania agentowe
| Benchmark | Kimi K2.5 (Swarm) | Kimi K2.5 (Agent) | Claude Sonnet 4.5 |
|---|---|---|---|
| BrowseComp | 78.4% | 60.2% | 52.1% |
| WebArena | 71.3% | 58.7% | 54.8% |
Praktyczne zastosowania
Refaktoryzacja kodu
Kimi K2.5 radzi sobie świetnie z refaktoryzacją dużych baz kodu. Dzięki oknowi kontekstowemu 256K tokenów możesz przekazać mu wiele plików jednocześnie.
const prompt = `
Refactor the following React code from class components to functional components with hooks.
Maintain identical behavior and TypeScript types.
${classComponentCode}
`;Generowanie testów
const prompt = `
Generate unit tests (Jest + React Testing Library) for the UserProfile component.
Cover scenarios: loading state, error state, successful render, user interaction.
${userProfileComponent}
`;Code review
const prompt = `
Review this pull request for:
- Potential bugs
- Performance issues
- Security (OWASP Top 10)
- TypeScript best practices compliance
${diffContent}
`;Dokumentacja API
const prompt = `
Based on this NestJS code, generate OpenAPI documentation in YAML format.
Include all endpoints, parameters, response types, and error codes.
${nestjsControllers}
`;Kimi vs Claude Code - porównanie narzędzi CLI
| Cecha | Kimi Code CLI | Claude Code |
|---|---|---|
| Licencja | Apache 2.0 | Zamknięta |
| Model bazowy | Kimi K2.5 (open source) | Claude (zamknięty) |
| Integracja IDE | VS Code, Cursor, Zed, JetBrains | VS Code |
| MCP | Tak | Tak |
| Agent Swarm | Tak | Nie |
| Instalacja | pip (Python 3.10+) | npm |
| Cena API | $0.60/$2.50 za 1M tokenów | $3/$15 za 1M tokenów |
| Shell mode | Ctrl-X toggle | Wbudowany |
| GitHub Stars | 6,400+ | 40,000+ |
| Dojrzałość | Nowsze, aktywny rozwój | Bardziej dojrzałe |
Oba narzędzia mają swoje mocne strony. Claude Code jest bardziej dojrzały i ma większą społeczność. Kimi Code jest tańszy, open-source i oferuje unikalne Agent Swarm. Wybór zależy od priorytetów: budżet i otwartość vs stabilność i ekosystem.
Moonshot AI - firma za Kimi
Moonshot AI to chiński startup założony w marcu 2023 roku. Firma szybko zdobyła finansowanie od największych graczy technologicznych:
- Luty 2024 - Runda $1 miliarda prowadzona przez Alibaba Group, wycena $2.5 miliarda
- Październik 2025 - Runda ~$600 milionów prowadzona przez IDG Capital z udziałem Tencent, wycena $3.8 miliarda
Moonshot AI wyróżnia się strategią open-source w regionie, gdzie większość firm AI stawia na zamknięte modele. Ich podejście buduje zaufanie społeczności deweloperów i przyspiesza adopcję.
Ograniczenia i wyzwania
- Dostępność regionalna - API hostowane w Chinach, co może oznaczać wyższe opóźnienia z Europy
- Dokumentacja - Część dokumentacji dostępna głównie po chińsku
- Ekosystem - Mniejszy ekosystem narzędzi i integracji niż OpenAI czy Anthropic
- Wsparcie Windows - Kimi Code CLI wymaga WSL 2, brak natywnego wsparcia Windows
- Agent Swarm w Beta - Technologia nadal w fazie testów, możliwe niestabilności
- Geopolityka - Chiński model AI może budzić obawy regulacyjne w niektórych organizacjach
FAQ
Czy Kimi K2.5 jest darmowe?
Chatbot na kimi.com jest darmowy z dziennymi limitami. API jest płatne ($0.60/$2.50 za milion tokenów). Wagi modelu są open-source i można uruchomić model lokalnie, jeśli masz odpowiedni sprzęt.
Czy mogę uruchomić Kimi lokalnie?
Tak, model jest dostępny na Hugging Face. Pełny model wymaga jednak znacznych zasobów GPU ze względu na 1 bilion parametrów. Wersja z kwantyzacją INT4 jest bardziej przystępna.
Czy Kimi API jest kompatybilne z OpenAI?
Tak, Kimi API używa formatu kompatybilnego z OpenAI. Możesz użyć oficjalnego SDK OpenAI, zmieniając tylko base_url i api_key.
Jak Kimi K2.5 radzi sobie z polskim?
Model obsługuje wiele języków, w tym polski. Jakość odpowiedzi w polskim jest dobra, choć najlepsze wyniki osiąga w angielskim i chińskim, na których był głównie trenowany.
Czym Agent Swarm różni się od zwykłego agenta?
Agent wykonuje zadania sekwencyjnie - jedno po drugim. Agent Swarm rozkłada zadanie na podzadania i przydziela je wielu agentom pracującym równolegle, co drastycznie skraca czas realizacji złożonych zadań.
Czy Kimi Code CLI może zastąpić Claude Code?
Zależy od potrzeb. Kimi Code jest tańszy i open-source, ale Claude Code ma większy ekosystem i dojrzałość. Dla budżetowych projektów lub gdy zależy ci na otwartości - Kimi Code jest solidną alternatywą.
Podsumowanie
Kimi od Moonshot AI to jeden z najciekawszych graczy na rynku AI w 2026 roku. Połączenie modelu o 1 bilonie parametrów, otwartych wag, przystępnej ceny API i przełomowej technologii Agent Swarm sprawia, że Kimi K2.5 jest poważną alternatywą dla zamkniętych modeli od OpenAI, Anthropic czy Google.
Dla programistów szczególnie interesujące są trzy aspekty: wyniki na SWE-Bench (76.8%), visual coding z OCRBench (92.3%) i Kimi Code CLI jako open-source'owa alternatywa dla Claude Code.
Jeśli szukasz potężnego modelu AI do kodowania, który nie zrujnuje budżetu - Kimi K2.5 zasługuje na poważne rozważenie.