Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

Dagens svensklektion – 30 december 2025

Tema: RAG-arkitektur i praktiken (index, embeddings, sök)


1️⃣ Dagens ord (6 nya ord)

1. inbäddning (embedding)

Uttal: in-bädd-ning Definition: En numerisk representation av text (eller annat innehåll) som fångar betydelse. Engelska: embedding Exempel:

Vi beräknar inbäddningar för dokumenten innan de läggs i indexet.


2. vektordatabas

Uttal: vek-tor-da-ta-bas Definition: Databas som lagrar vektorer (t.ex. inbäddningar) och möjliggör likhetssökning. Engelska: vector database Exempel:

En vektordatabas gör det möjligt att hitta semantiskt liknande dokument snabbt.


3. likhetssökning

Uttal: lik-hets-sök-ning Definition: Sökning baserad på “hur likt” något är, ofta via vektorer. Engelska: similarity search Exempel:

Likhetssökning ger ofta bättre träffar än ren nyckelordssökning.


4. rankning

Uttal: rank-ning Definition: Att sortera sökträffar i en ordning som maximerar relevans. Engelska: ranking Exempel:

Rankning är kritiskt för att RAG ska hämta rätt kontext.


5. återhämtning (retrieval)

Uttal: å-ter-hämt-ning Definition: Steget där systemet hämtar relevanta dokument eller stycken till modellen. Engelska: retrieval Exempel:

Återhämtningen styr vilken information modellen får som underlag.


6. kontextfönster

Uttal: kon-tekst-föns-ter Definition: Den mängd text (tokens) modellen kan ta in vid ett tillfälle. Engelska: context window Exempel:

Vi måste anpassa mängden text till modellens kontextfönster.


2️⃣ Dagens meningar (6 meningar)

  1. Vi skapar inbäddningar för dokument och lagrar dem i en vektordatabas.
  2. Likhetssökning används för att hitta relevanta avsnitt utifrån användarens fråga.
  3. Rankning avgör vilka träffar som hamnar i topp och skickas vidare.
  4. Återhämtningen behöver vara snabb och stabil även vid hög belastning.
  5. Kontextfönstret begränsar hur mycket material som kan skickas till modellen.
  6. En bra RAG-lösning balanserar relevans, kostnad och svarstid.

3️⃣ Dialog / Talträning

Kollega: Varför behöver vi en vektordatabas i RAG? Jag: För att kunna göra likhetssökning på inbäddningar och hitta semantiskt relevanta dokument. Kollega: Räcker det inte med nyckelordssökning? Jag: I vissa fall, men likhetssökning ger ofta bättre träffar när frågorna är mer fria. Kollega: Vad är den största begränsningen? Jag: Kontextfönstret – vi måste ranka och filtrera så vi bara skickar det viktigaste.

🎤 Tala högt: – Hur skulle du beskriva inbäddningar för en icke-teknisk person? – Varför är rankning så viktig i RAG?


4️⃣ Lyssning (simulerad)

Talad text:

I en RAG-lösning börjar vi ofta med att dela upp dokument i mindre stycken och skapa inbäddningar för varje stycke. Dessa lagras i en vektordatabas, vilket gör det möjligt att söka efter semantiskt liknande innehåll. När en användare ställer en fråga gör vi en återhämtning av de mest relevanta styckena, rankar dem och skickar en begränsad mängd text till modellen. På så sätt kan vi få mer relevanta och spårbara svar utan att överbelasta kontextfönstret.

Förståelsefrågor:

  1. Varför delas dokument upp i mindre stycken?
  2. Vad används vektordatabasen till?
  3. Varför skickas bara en begränsad mängd text till modellen?

5️⃣ Läsförståelse

Text:

I praktiken består en RAG-arkitektur av flera tydliga steg. Först skapas inbäddningar för dokument eller dokumentsegment och lagras i en vektordatabas. Därefter används likhetssökning för att hitta de mest relevanta delarna baserat på användarens fråga. Rankning och filtrering förbättrar kvaliteten genom att prioritera de träffar som har högst relevans.

En vanlig utmaning är modellens kontextfönster. Eftersom det finns en gräns för hur mycket text som kan skickas till modellen måste återhämtningen vara selektiv. Ett välbalanserat upplägg kan ge hög kvalitet utan att bli dyrt eller långsamt, särskilt om man kombinerar bra indexering med effektiv återhämtning.

Frågor:

  1. Vilka huvudsteg ingår i en RAG-arkitektur?
  2. Varför behövs rankning och filtrering?
  3. Vilken begränsning påverkar hur mycket text som kan skickas?
  4. Sammanfatta texten med 2–3 meningar.

6️⃣ Skrivövning ✍️

Uppgift: Skriv 5–8 meningar som svar på frågan:

Hur skulle du optimera en RAG-lösning för både kvalitet och kostnad?

Krav:

  • professionell svenska
  • lugn och saklig ton
  • använd minst tre av dagens ord

Exempel:

Jag skulle fokusera på att förbättra likhetssökningen och rankningen i RAG-lösningen för att öka effektiviteten. Genom mer träffsäker återhämtning kan vi minska mängden onödig kontext som skickas till modellen. Detta bidrar direkt till lägre beräkningskostnader och kortare svarstider. Vektordatabasens storlek behöver hållas under kontroll för att balansera prestanda och lagringskostnader. Samtidigt är det viktigt att anpassa kontextfönstrets storlek efter användningsfallet. Ett välavvägt upplägg ger både hög kvalitet i svaren och en mer kostnadseffektiv drift över tid.

🔹 Professionella uttryck som höjer nivån

  • träffsäker återhämtning
  • onödig kontext
  • beräkningskostnader
  • kostnadseffektiv drift
  • över tid