Lokale KI – Grundlagen

Aus Xinux Wiki
Zur Navigation springen Zur Suche springen

Lokale KI – Grundlagen

Was ist eine KI bzw. ein Sprachmodell?

Ein großes Sprachmodell (englisch: Large Language Model, kurz LLM) ist ein Computerprogramm, das Text versteht und erzeugt. Es wurde darauf trainiert, auf Fragen zu antworten, Texte zusammenzufassen, Code zu schreiben oder Probleme zu erklären.

Bekannte Beispiele sind ChatGPT (OpenAI), Gemini (Google) oder Claude (Anthropic). Diese laufen in der Cloud – der Text wird also an fremde Server geschickt, dort verarbeitet und die Antwort zurückgeschickt.

Eine lokale KI läuft dagegen vollständig auf dem eigenen Rechner. Es werden keine Daten nach außen übertragen.

Woher kommen die Daten?

Ein Sprachmodell wird mit enormen Mengen an Text trainiert – hauptsächlich aus dem Internet:

  • Webseiten (Common Crawl – ein Archiv eines Großteils des öffentlichen Internets)
  • Wikipedia
  • Bücher und wissenschaftliche Artikel
  • Programmiercode (z.B. von GitHub)
  • Nachrichtenartikel, Foren, soziale Netzwerke

Das Training eines großen Modells wie Llama kostet Millionen von Euro und dauert Wochen auf tausenden von GPUs. Das Ergebnis ist eine einzelne Datei – das Modell – die das gesammelte „Wissen" in Form von Milliarden von Zahlenwerten speichert.

Wie funktioniert eine Antwort?

Das Modell erzeugt Antworten Wort für Wort (genauer: Token für Token). Es berechnet bei jedem Schritt, welches Wort als nächstes am wahrscheinlichsten passt – basierend auf allem, was es während des Trainings gesehen hat.

Es „weiß" nichts im menschlichen Sinne – es erkennt statistische Muster in Sprache und wendet diese an.

Lokal vs. Cloud

Lokal Cloud
Datenschutz Daten bleiben auf dem Rechner Daten gehen an externe Server
Kosten Einmalig (Hardware) Laufende Kosten (API, Abo)
Geschwindigkeit Abhängig von Hardware Meist schneller
Internetverbindung Nicht nötig Erforderlich
Modellgröße Begrenzt durch RAM/VRAM Keine Einschränkung

Bekannte lokale Modelle

Modell Hersteller Besonderheit
Llama 3 Meta Weit verbreitet, gute Qualität
Mistral Mistral AI Effizient, gutes Preis-Leistungs-Verhältnis
Qwen Alibaba Gut für Deutsch und Code
DeepSeek DeepSeek AI Stark im logischen Denken
Gemma Google Kompakt und schnell

Zusammenfassung

Eine lokale KI ist ein trainiertes Sprachmodell, das auf dem eigenen Rechner läuft. Es wurde mit Texten aus dem Internet trainiert und erzeugt Antworten durch statistische Mustererkennung. Der größte Vorteil gegenüber Cloud-Lösungen ist der Datenschutz – kein Text verlässt den eigenen Rechner.