LLM für den Hausgebrauch – Large Language Models verständlich erklärt

Kompaktes Lehrskript: von Tokenisierung bis Transformer & RAG – verständlich erklärt und mathematisch sauber, inkl. Notebooks.

📄 Downloads

LLM für den Hausgebrauch (PDF)

Tokenisierung, Embeddings, Self-Attention, Transformer, RAG + Mathe/Notebooks.

Downloads: –

Vektordatenbanken & Semantische Suche (PDF)

Embeddings, Similarity Search, Qdrant, HNSW, RAG-Anbindung (mit Beispielen).

Downloads: –

Vektorsuche vs. SQL-Suche (PDF)

Wie Qdrant zu seinem Ergebnis kommt: Indexaufbau/Online-Suche, Beispiel „Schiff“, Vergleichstabelle Qdrant vs. LIKE.

Downloads: –

HNSW – Hierarchical Navigable Small World (PDF)

Von Brute Force (O(n)) zu HNSW (O(log n)): Ebenen, Greedy-Suche, Parameter m/ef/ef_construct, B-Tree-Analogie.

Downloads: –

Was drin ist (Kurzüberblick):

Wie LLMs Tokens in Wahrscheinlichkeiten und Antworten verwandeln
Transformer & Self-Attention (mit Rechenbeispielen)
Training: Softmax, Cross-Entropy, Gradienten/Backpropagation
RAG: Kontext-Erweiterung zur Laufzeit statt Retraining
Vektor-DBs: Embeddings, Similarity Search, Indexing (HNSW)
Vektorsuche vs. SQL-Suche: semantische Ähnlichkeit vs. exakte Text-/Filterabfragen
HNSW-Index: schnelle Approximate-Nearest-Neighbor-Suche über Graph + Hierarchie