Inhoudsopgave

Het bouwen van een privacy-first AI klantenservice-agent met LanceDB, Ollama en Node.js

AI klantenservice-agent met LanceDB Ollama Node.js

Note

Dit document beschrijft onze reis bij het bouwen van een zelf-gehoste AI support agent. We schreven over soortgelijke uitdagingen in onze Email Startup Graveyard blogpost. We dachten eerlijk gezegd aan het schrijven van een vervolg genaamd "AI Startup Graveyard", maar misschien moeten we nog een jaar wachten totdat de AI-bubbel mogelijk barst(?). Voor nu is dit onze brain dump van wat werkte, wat niet werkte, en waarom we het op deze manier deden.

Dit is hoe we onze eigen AI klantenservice-agent bouwden. We deden het op de moeilijke manier: zelf-gehost, privacy-first, en volledig onder onze controle. Waarom? Omdat we derde partijen niet vertrouwen met de data van onze klanten. Het is een GDPR- en DPA-vereiste, en het is de juiste keuze.

Dit was geen leuk weekendproject. Het was een maandlange reis door kapotte dependencies, misleidende documentatie, en de algemene chaos van het open-source AI-ecosysteem in 2025. Dit document is een verslag van wat we bouwden, waarom we het bouwden, en de obstakels die we onderweg tegenkwamen.

Klantvoordelen: AI-ondersteunde Menselijke Support

Ons AI-systeem vervangt ons supportteam niet—het maakt ze beter. Dit betekent het volgende voor jou:

Snellere, Nauwkeurigere Reacties

Mens-in-de-Lus: Elke door AI gegenereerde concepttekst wordt beoordeeld, bewerkt en samengesteld door ons menselijke supportteam voordat deze naar jou wordt verzonden. De AI verzorgt het initiële onderzoek en het opstellen, waardoor ons team zich kan richten op kwaliteitscontrole en personalisatie.

Getraind op Menselijke Expertise: De AI leert van:

Onze handgeschreven kennisbank en documentatie
Door mensen geschreven blogposts en tutorials
Onze uitgebreide FAQ (geschreven door mensen)
Eerdere klantgesprekken (allemaal afgehandeld door echte mensen)

Je krijgt antwoorden die zijn geïnformeerd door jarenlange menselijke expertise, alleen dan sneller geleverd.

Consistentie Zonder Burn-out

Ons kleine team verwerkt dagelijks honderden supportverzoeken, elk met verschillende technische kennis en mentale contextwisselingen:

Vragen over facturatie vereisen kennis van financiële systemen
DNS-problemen vereisen netwerkexpertise
API-integratie vereist programmeerkennis
Beveiligingsrapporten vereisen kwetsbaarheidsbeoordeling

Zonder AI-ondersteuning leidt deze constante contextwisseling tot:

Langzamere reactietijden
Menselijke fouten door vermoeidheid
Inconsistente antwoordkwaliteit
Team burn-out

Met AI-ondersteuning:

Reageert ons team sneller (AI maakt concepten in seconden)
Maakt minder fouten (AI vangt veelvoorkomende fouten op)
Handhaaft consistente kwaliteit (AI raadpleegt elke keer dezelfde kennisbank)
Blijft fris en gefocust (minder tijd aan onderzoek, meer tijd om te helpen)

Wat Je Krijgt

✅ Snelheid: AI stelt antwoorden binnen seconden op, mensen beoordelen en verzenden binnen enkele minuten

✅ Nauwkeurigheid: Antwoorden gebaseerd op onze daadwerkelijke documentatie en eerdere oplossingen

✅ Consistentie: Steeds dezelfde hoogwaardige antwoorden, of het nu 9 uur ’s ochtends of 9 uur ’s avonds is

✅ Menselijke toets: Elk antwoord wordt beoordeeld en gepersonaliseerd door ons team

✅ Geen hallucinaties: AI gebruikt alleen onze geverifieerde kennisbank, niet generieke internetdata

Note

Je spreekt altijd met mensen. De AI is een onderzoeksassistent die ons team helpt het juiste antwoord sneller te vinden. Zie het als een bibliothecaris die direct het relevante boek vindt—maar een mens leest het nog steeds en legt het aan je uit.

Een Persoonlijke Reflectie: De Twee Decennia Durende Inspanning

Voordat we de technische details induiken, een persoonlijke noot. Ik ben hier al bijna twee decennia mee bezig. De eindeloze uren achter het toetsenbord, de onvermoeibare zoektocht naar een oplossing, de diepe, gefocuste inspanning – dit is de realiteit van het bouwen van iets betekenisvols. Het is een realiteit die vaak wordt weggelaten in de hype rond nieuwe technologieën.

De recente explosie van AI is bijzonder frustrerend geweest. Ons wordt een droom verkocht van automatisering, van AI-assistenten die onze code schrijven en onze problemen oplossen. De realiteit? De output is vaak prullenbakcode die meer tijd kost om te repareren dan het zou hebben gekost om vanaf nul te schrijven. De belofte om ons leven makkelijker te maken is een valse. Het is een afleiding van het harde, noodzakelijke werk van bouwen.

En dan is er de catch-22 van bijdragen aan open source. Je bent al overbelast, uitgeput van de inspanning. Je gebruikt AI om je te helpen een gedetailleerd, goed gestructureerd bugrapport te schrijven, in de hoop het voor beheerders makkelijker te maken het probleem te begrijpen en op te lossen. En wat gebeurt er? Je wordt berispt. Je bijdrage wordt afgedaan als "off-topic" of weinig inspanning, zoals we zagen in een recent Node.js GitHub-issue. Het is een klap in het gezicht van senior ontwikkelaars die gewoon willen helpen.

Dit is de realiteit van het ecosysteem waarin we werken. Het gaat niet alleen om kapotte tools; het gaat om een cultuur die vaak faalt om de tijd en inspanning van haar bijdragers te respecteren. Deze post is een kroniek van die realiteit. Het is een verhaal over de tools, ja, maar ook over de menselijke kosten van bouwen in een kapot ecosysteem dat, ondanks alle beloften, fundamenteel kapot is.

Waarom Privacy Belangrijk Is

Ons technisch whitepaper behandelt onze privacyfilosofie uitgebreid. De korte versie: we sturen nooit klantgegevens naar derden. Nooit. Dat betekent geen OpenAI, geen Anthropic, geen cloud-gehoste vector databases. Alles draait lokaal op onze infrastructuur. Dit is niet onderhandelbaar voor GDPR-naleving en onze DPA-verplichtingen.

Kostenanalyse: Cloud AI vs Zelf-Hosten

Voordat we ingaan op de technische implementatie, laten we het hebben over waarom zelf-hosten belangrijk is vanuit kostenperspectief. De prijsmodellen van cloud AI-diensten maken ze onbetaalbaar voor gebruik met hoog volume, zoals klantenservice.

Vergelijking Cloud AI Diensten

Dienst	Provider	Embedding Kosten	LLM Kosten (Input)	LLM Kosten (Output)	Privacybeleid	GDPR/DPA	Hosting	Gegevensdeling
OpenAI	OpenAI (VS)	$0.02-0.13/1M tokens	$0.15-20/1M tokens	$0.60-80/1M tokens	Link	Beperkte DPA	Azure (VS)	Ja (training)
Claude	Anthropic (VS)	N.v.t.	$3-20/1M tokens	$15-80/1M tokens	Link	Beperkte DPA	AWS/GCP (VS)	Nee (geclaimd)
Gemini	Google (VS)	$0.15/1M tokens	$0.30-1.00/1M tokens	$2.50/1M tokens	Link	Beperkte DPA	GCP (VS)	Ja (verbetering)
DeepSeek	DeepSeek (China)	N.v.t.	$0.028-0.28/1M tokens	$0.42/1M tokens	Link	Onbekend	China	Onbekend
Mistral	Mistral AI (Frankrijk)	$0.10/1M tokens	$0.40/1M tokens	$2.00/1M tokens	Link	EU GDPR	EU	Onbekend
Zelf-Hosten	Jij	$0 (bestaande hardware)	$0 (bestaande hardware)	$0 (bestaande hardware)	Jouw beleid	Volledige naleving	MacBook M5 + cron	Nooit

Warning

Zorgen over data-soevereiniteit: Amerikaanse providers (OpenAI, Claude, Gemini) vallen onder de CLOUD Act, waardoor de Amerikaanse overheid toegang heeft tot data. DeepSeek (China) opereert onder Chinese datalaws. Hoewel Mistral (Frankrijk) EU-hosting en GDPR-naleving biedt, blijft zelf-hosten de enige optie voor volledige data-soevereiniteit en controle.

Kostenoverzicht: 5GB Kennisbank

Laten we de kosten berekenen voor het verwerken van een kennisbank van 5GB (typisch voor een middelgroot bedrijf met documenten, e-mails en supportgeschiedenis).

Aannames:

5GB tekst ≈ 1,25 miljard tokens (uitgaande van ~4 tekens/token)
Initiële embedding generatie
Maandelijkse hertraining (volledige re-embedding)
10.000 supportvragen per maand
Gemiddelde vraag: 500 tokens input, 300 tokens output Gedetailleerde Kostenopbouw:

Component	OpenAI	Claude	Gemini	Zelf-gehost
Initiële Embedding (1,25B tokens)	$25,000	N/B	$187,500	$0
Maandelijkse Queries (10K × 800 tokens)	$1,200-16,000	$2,400-16,000	$2,400-3,200	$0
Maandelijkse Retraining (1,25B tokens)	$25,000	N/B	$187,500	$0
Totaal Eerste Jaar	$325,200-217,000	$28,800-192,000	$2,278,800-2,226,000	~ $60 (elektriciteit)
Privacy Compliance	❌ Beperkt	❌ Beperkt	❌ Beperkt	✅ Volledig
Data Soevereiniteit	❌ Nee	❌ Nee	❌ Nee	✅ Ja

Caution

De embeddingkosten van Gemini zijn catastrofaal met $0,15/1M tokens. Een enkele 5GB kennisbank embedding zou $187,500 kosten. Dit is 37x duurder dan OpenAI en maakt het volledig onbruikbaar voor productie.

Zelf-gehoste Hardware Kosten

Onze setup draait op bestaande hardware die we al bezitten:

Hardware: MacBook M5 (al in bezit voor ontwikkeling)
Extra kosten: $0 (gebruikt bestaande hardware)
Elektriciteit: ~$5/maand (geschat)
Totaal eerste jaar: ~$60
Doorlopend: $60/jaar

ROI: Zelf-hosting heeft vrijwel geen marginale kosten omdat we bestaande ontwikkelhardware gebruiken. Het systeem draait via cron jobs tijdens daluren.

Onze Eigen API Gebruiken

Een van de belangrijkste architecturale beslissingen die we hebben genomen, was om alle AI-taken direct de Forward Email API te laten gebruiken. Dit is niet alleen goede praktijk—het is een drijfveer voor prestatieoptimalisatie.

Waarom Eigen Gebruik Belangrijk Is

Wanneer onze AI-taken dezelfde API-eindpunten gebruiken als onze klanten:

Prestatieknelpunten treffen ons eerst - Wij voelen de pijn voordat klanten dat doen
Optimalisatie profiteert iedereen - Verbeteringen voor onze taken verbeteren automatisch de klantervaring
Testen in de praktijk - Onze taken verwerken duizenden e-mails, wat continue load testing biedt
Code hergebruik - Zelfde authenticatie, rate limiting, foutafhandeling en caching logica

API Gebruik Voorbeelden

Berichten Lijst Opvragen (train-from-history.js):

// Gebruikt GET /v1/messages?folder=INBOX met BasicAuth
// Sluit eml, raw, nodemailer uit om responsegrootte te verkleinen (alleen IDs nodig)
const response = await axios.get(
  `${this.apiBase}/v1/messages`,
  {
    params: {
      folder: 'INBOX',
      limit: 100,
      eml: false,
      raw: false,
      nodemailer: false
    },
    auth: {
      username: process.env.FORWARD_EMAIL_ALIAS_USERNAME,
      password: process.env.FORWARD_EMAIL_ALIAS_PASSWORD
    }
  }
);

const messages = response.data;
// Retourneert: [{ id, subject, date, ... }, ...]
// Volledige berichtinhoud wordt later opgehaald via GET /v1/messages/:id

Volledige Berichten Ophalen (forward-email-client.js):

// Gebruikt GET /v1/messages/:id om volledig bericht met raw content te krijgen
const response = await axios.get(
  `${this.apiBase}/v1/messages/${messageId}`,
  {
    auth: {
      username: this.aliasUsername,
      password: this.aliasPassword
    }
  }
);

const message = response.data;
// Retourneert: { id, subject, raw, eml, nodemailer: { ... }, ... }

Concept Antwoorden Maken (process-inbox.js):

// Gebruikt POST /v1/messages om conceptantwoorden te maken
const response = await axios.post(
  `${this.apiBase}/v1/messages`,
  {
    folder: 'Drafts',
    subject: `Re: ${originalSubject}`,
    to: senderEmail,
    text: generatedResponse,
    inReplyTo: originalMessageId
  },
  {
    auth: {
      username: process.env.FORWARD_EMAIL_ALIAS_USERNAME,
      password: process.env.FORWARD_EMAIL_ALIAS_PASSWORD
    }
  }
);

Prestatievoordelen

Omdat onze AI-taken op dezelfde API-infrastructuur draaien:

Caching-optimalisaties profiteren zowel taken als klanten
Rate limiting wordt getest onder echte belasting
Foutafhandeling is grondig getest
API-responstijden worden continu gemonitord
Databasequery's zijn geoptimaliseerd voor beide gebruiksscenario's
Bandbreedte-optimalisatie - Het uitsluiten van eml, raw, nodemailer bij het opvragen verkleint de responsgrootte met ~90%

Wanneer train-from-history.js 1.000 e-mails verwerkt, doet het meer dan 1.000 API-aanroepen. Elke inefficiëntie in de API wordt direct duidelijk. Dit dwingt ons om IMAP-toegang, databasequery's en response-serialisatie te optimaliseren—verbeteringen die direct onze klanten ten goede komen.

Voorbeeldoptimalisatie: 100 berichten met volledige inhoud opvragen = ~10MB respons. Opvragen met eml: false, raw: false, nodemailer: false = ~100KB respons (100x kleiner).

Encryptie Architectuur

Onze e-mailopslag gebruikt meerdere lagen van encryptie, die de AI-taken in realtime moeten ontsleutelen voor training.

Laag 1: Mailbox Encryptie (chacha20-poly1305)

Alle IMAP-mailboxen worden opgeslagen als SQLite-databases die versleuteld zijn met chacha20-poly1305, een quantum-veilige encryptie-algoritme. Dit wordt uitgelegd in onze quantum-veilige versleutelde e-mailservice blogpost.

Belangrijke eigenschappen:

Algoritme: ChaCha20-Poly1305 (AEAD-cijfer)
Quantum-veilig: Bestand tegen aanvallen met quantumcomputers
Opslag: SQLite-databasebestanden op schijf
Toegang: Ontsleuteld in het geheugen bij toegang via IMAP/API

Laag 2: Berichtniveau PGP Encryptie

Veel support-e-mails zijn daarnaast versleuteld met PGP (OpenPGP-standaard). De AI-taken moeten deze ontsleutelen om inhoud voor training te extraheren.

Ontsleutelingsproces:

// 1. API retourneert bericht met versleutelde raw-inhoud
const message = await forwardEmailClient.getMessage(id);

// 2. Controleren of raw-inhoud PGP-versleuteld is
if (isMessageEncrypted(message.raw)) {
  // 3. Ontsleutelen met onze privésleutel
  const decryptedRaw = await pgpDecrypt(message.raw);

  // 4. Parseren van het ontsleutelde MIME-bericht
  const parsed = await simpleParser(decryptedRaw);

  // 5. Nodemailer vullen met ontsleutelde inhoud
  message.nodemailer = {
    text: parsed.text,
    html: parsed.html,
    from: parsed.from,
    to: parsed.to,
    subject: parsed.subject,
    date: parsed.date
  };
}

PGP-configuratie:

# Privésleutel voor ontsleuteling (pad naar ASCII-armored sleutelbestand)
GPG_SECURITY_KEY="/path/to/private-key.asc"

# Wachtwoord voor privésleutel (indien versleuteld)
GPG_SECURITY_PASSPHRASE="your-passphrase"

De pgp-decrypt.js helper:

Leest de privésleutel één keer van schijf (in geheugen gecached)
Ontsleutelt de sleutel met de passphrase
Gebruikt de ontsleutelde sleutel voor alle berichtontsleutelingen
Ondersteunt recursieve ontsleuteling voor geneste versleutelde berichten

Waarom Dit Belangrijk Is Voor Training

Zonder juiste ontsleuteling zou de AI trainen op versleutelde onzin:

-----BEGIN PGP MESSAGE-----
Version: OpenPGP.js v4.10.10

wcBMA8Z3lHJnFnNUAQgAqK7F8...
-----END PGP MESSAGE-----

Met ontsleuteling traint de AI op daadwerkelijke inhoud:

Subject: Re: Bug Report

Hi John,

Thanks for reporting this issue. I've confirmed the bug
and created a fix in PR #1234...

Opslagbeveiliging

De ontsleuteling gebeurt in het geheugen tijdens de uitvoering van de taak, en de ontsleutelde inhoud wordt omgezet in embeddings die vervolgens worden opgeslagen in de LanceDB vector database op schijf.

Waar de data zich bevindt:

Vector database: Opgeslagen op versleutelde MacBook M5 werkstations
Fysieke beveiliging: Werkstations blijven te allen tijde bij ons (niet in datacenters)
Schijfversleuteling: Volledige schijfversleuteling op alle werkstations
Netwerkbeveiliging: Afgeschermd en geïsoleerd van openbare netwerken

Toekomstige datacenter-implementatie: Als we ooit naar datacenterhosting gaan, zullen de servers beschikken over:

LUKS volledige schijfversleuteling
USB-toegang uitgeschakeld
Fysieke beveiligingsmaatregelen
Netwerkisolatie Voor volledige details over onze beveiligingspraktijken, zie onze Beveiligingspagina.

Note

De vectordatabase bevat embeddings (wiskundige representaties), niet de originele platte tekst. Embeddings kunnen echter mogelijk worden terugontleed, daarom bewaren we ze op versleutelde, fysiek beveiligde werkstations.

Lokale opslag is standaardpraktijk

Het opslaan van embeddings op de werkstations van ons team verschilt niet van hoe we al met e-mail omgaan:

Thunderbird: Downloadt en slaat volledige e-mailinhoud lokaal op in mbox/maildir-bestanden
Webmailclients: Cachen e-mailgegevens in browseropslag en lokale databases
IMAP-clients: Behouden lokale kopieën van berichten voor offline toegang
Ons AI-systeem: Slaat wiskundige embeddings (geen platte tekst) op in LanceDB

Het belangrijkste verschil: embeddings zijn veiliger dan platte tekst e-mail omdat ze:

Wiskundige representaties zijn, geen leesbare tekst
Moeilijker terug te ontleden zijn dan platte tekst
Nog steeds onder dezelfde fysieke beveiliging vallen als onze e-mailclients

Als het acceptabel is voor ons team om Thunderbird of webmail op versleutelde werkstations te gebruiken, is het net zo acceptabel (en waarschijnlijk veiliger) om embeddings op dezelfde manier op te slaan.

De architectuur

Hier is de basisstroom. Het lijkt eenvoudig. Dat was het niet.

Note

Alle taken gebruiken direct de Forward Email API, zodat prestatieoptimalisaties zowel ons AI-systeem als onze klanten ten goede komen.

Hoog-niveau stroom

Gedetailleerde scraper-stroom

De scraper.js is het hart van de data-inname. Het is een verzameling parsers voor verschillende dataformaten.

Hoe het werkt

Het proces is opgesplitst in drie hoofdonderdelen: het opbouwen van de kennisbasis, trainen met historische e-mails en het verwerken van nieuwe e-mails.

Het opbouwen van de kennisbasis

update-knowledge-base.js: Dit is de hoofdtaak. Deze draait ’s nachts, wist de oude vectoropslag en bouwt deze helemaal opnieuw op. Het gebruikt scraper.js om inhoud van alle bronnen op te halen, processor.js om het op te delen, en ollama-client.js om embeddings te genereren. Ten slotte slaat vector-store.js alles op in LanceDB.

Databronnen:

Lokale Markdown-bestanden (docs/*.md)
Technisch whitepaper PDF (assets/technical-whitepaper.pdf)
API-specificatie JSON (assets/api-spec.json)
GitHub issues (via Octokit)
GitHub discussies (via Octokit)
GitHub pull requests (via Octokit)
Sitemap URL-lijst ($LANCEDB_PATH/valid-urls.json)

Trainen met historische e-mails

train-from-history.js: Deze taak scant historische e-mails uit alle mappen, ontsleutelt PGP-versleutelde berichten en voegt ze toe aan een aparte vectoropslag (customer_support_history). Dit biedt context uit eerdere supportinteracties. E-mailverwerkingsstroom:

Belangrijkste kenmerken:

PGP-ontsleuteling: Gebruikt pgp-decrypt.js helper met GPG_SECURITY_KEY omgevingsvariabele
Threadgroepering: Groepeert gerelateerde e-mails in gespreksthreads
Metadata behoud: Slaat map, onderwerp, datum, encryptiestatus op
Antwoordcontext: Verbindt berichten met hun antwoorden voor betere context

Configuratie:

# Omgevingsvariabelen voor train-from-history
HISTORY_SCAN_LIMIT=1000              # Maximaal te verwerken berichten
HISTORY_SCAN_SINCE="2024-01-01"      # Alleen berichten na deze datum verwerken
HISTORY_DECRYPT_PGP=true             # Poging tot PGP-ontsleuteling
GPG_SECURITY_KEY="/path/to/key.asc"  # Pad naar PGP privésleutel
GPG_SECURITY_PASSPHRASE="passphrase" # Sleutelwachtwoord (optioneel)

Wat wordt opgeslagen:

{
  type: 'historical_email',
  folder: 'INBOX',
  subject: 'Re: Bug Report',
  date: '2025-01-15T10:30:00Z',
  messageId: '67e2f288893921...',
  threadId: 'Bug Report',
  hasReply: true,
  encrypted: true,
  decrypted: true,
  replySubject: 'Bug Report',
  replyText: 'First 500 chars of reply...',
  chunkSize: 1000,
  chunkOverlap: 200,
  chunkIndex: 0
}

Tip

Voer train-from-history uit na de initiële setup om de historische context te vullen. Dit verbetert de responskwaliteit aanzienlijk door te leren van eerdere supportinteracties.

Binnenkomende e-mails verwerken

process-inbox.js: Deze taak draait op e-mails in onze support@forwardemail.net, abuse@forwardemail.net en security@forwardemail.net mailboxen (specifiek de INBOX IMAP-map). Het maakt gebruik van onze API op https://forwardemail.net/email-api (bijv. GET /v1/messages?folder=INBOX met BasicAuth toegang via onze IMAP-gegevens voor elke mailbox). Het analyseert de e-mailinhoud, raadpleegt zowel de kennisbank (forward_email_knowledge_base) als de historische e-mail vector store (customer_support_history), en geeft vervolgens de gecombineerde context door aan response-generator.js. De generator gebruikt mxbai-embed-large via Ollama om een antwoord te formuleren.

Geautomatiseerde workflowfuncties:

Inbox Zero Automatisering: Na het succesvol aanmaken van een concept wordt het originele bericht automatisch verplaatst naar de Archief-map. Dit houdt je inbox schoon en helpt inbox zero te bereiken zonder handmatige tussenkomst.
AI-verwerking overslaan: Voeg eenvoudig een skip-ai label toe (hoofdletterongevoelig) aan een bericht om AI-verwerking te voorkomen. Het bericht blijft onaangeroerd in je inbox, zodat je het handmatig kunt afhandelen. Dit is handig voor gevoelige berichten of complexe gevallen die menselijke beoordeling vereisen.
Correcte e-mailthreading: Alle conceptantwoorden bevatten het originele bericht geciteerd eronder (met de standaard > prefix), volgens de conventies voor e-mailantwoorden met het formaat "Op [datum], schreef [afzender]:". Dit zorgt voor correcte gesprekscontext en threading in e-mailclients.
Reply-All gedrag: Het systeem verwerkt automatisch Reply-To headers en CC-ontvangers:
- Als er een Reply-To header is, wordt dit het Aan-adres en wordt de originele Van toegevoegd aan CC
- Alle originele Aan- en CC-ontvangers worden opgenomen in de reply CC (behalve je eigen adres)
- Volgt standaard e-mail reply-all conventies voor groepsgesprekken Bronrangschikking: Het systeem gebruikt gewogen rangschikking om bronnen te prioriteren:

FAQ: 100% (hoogste prioriteit)
Technisch whitepaper: 95%
API-specificatie: 90%
Officiële documentatie: 85%
GitHub-issues: 70%
Historische e-mails: 50%

Vector Store Management

De VectorStore klasse in helpers/customer-support-ai/vector-store.js is onze interface naar LanceDB.

Documenten toevoegen:

// vector-store.js
async addDocument(text, metadata) {
  const embedding = await this.ollama.generateEmbedding(text);
  await this.table.add([{
    vector: embedding,
    text,
    ...metadata
  }]);
}

De opslag wissen:

// Optie 1: Gebruik de clear() methode
await vectorStore.clear();

// Optie 2: Verwijder de lokale database map
await fs.rm(process.env.LANCEDB_PATH, { recursive: true, force: true });

De omgevingsvariabele LANCEDB_PATH verwijst naar de lokale embedded database map. LanceDB is serverless en embedded, dus er is geen apart proces om te beheren.

De Vector Database Begraafplaats

Dit was de eerste grote hindernis. We hebben meerdere vector databases geprobeerd voordat we voor LanceDB kozen. Dit ging er mis bij elk van hen.

Database	GitHub	Wat er misging	Specifieke problemen	Beveiligingszorgen
ChromaDB	chroma-core/chroma	`pip3 install chromadb` geeft je een versie uit de prehistorie met `PydanticImportError`. De enige manier om een werkende versie te krijgen is compileren vanuit de bron. Niet ontwikkelaarsvriendelijk.	Chaos met Python dependencies. Meerdere gebruikers melden kapotte pip installs (#774, #163). De docs zeggen "gebruik gewoon Docker" wat geen antwoord is voor lokale ontwikkeling. Crasht op Windows met >99 records (#3058).	CVE-2024-45848: Arbitrary code execution via ChromaDB integratie in MindsDB. Kritieke OS kwetsbaarheden in Docker image (#3170).
Qdrant	qdrant/qdrant	De Homebrew tap (`qdrant/qdrant/qdrant`) die in hun oude docs werd genoemd is verdwenen. Weg. Geen uitleg. De officiële docs zeggen nu alleen "gebruik Docker."	Ontbrekende Homebrew tap. Geen native macOS binary. Alleen Docker is een barrière voor snel lokaal testen.	CVE-2024-2221: Arbitrary file upload kwetsbaarheid die remote code execution mogelijk maakt (opgelost in v1.9.0). Zwakke beveiligingsscore van IronCore Labs.
Weaviate	weaviate/weaviate	De Homebrew versie had een kritieke clustering bug (`leader not found`). De gedocumenteerde flags om dit te fixen (`RAFT_JOIN`, `CLUSTER_HOSTNAME`) werkten niet. Fundamenteel kapot voor single-node setups.	Clustering bugs zelfs in single-node modus. Over-engineered voor eenvoudige use cases.	Geen grote CVE's gevonden, maar complexiteit vergroot het aanvalsoppervlak.
LanceDB	lancedb/lancedb	Deze werkte. Het is embedded en serverless. Geen apart proces. De enige irritatie is de verwarrende pakketnaamgeving (`vectordb` is verouderd, gebruik `@lancedb/lancedb`) en verspreide documentatie. We kunnen daarmee leven.	Verwarring over pakketnaamgeving (`vectordb` vs `@lancedb/lancedb`), maar verder solide. Embedded architectuur elimineert hele klassen beveiligingsproblemen.	Geen bekende CVE's. Embedded ontwerp betekent geen netwerk-aanvalsoppervlak.

Warning

ChromaDB heeft kritieke beveiligingslekken. CVE-2024-45848 maakt willekeurige code-uitvoering mogelijk. De pip-installatie is fundamenteel kapot door Pydantic afhankelijkheidsproblemen. Vermijd gebruik in productie.

Warning

Qdrant had een RCE-kwetsbaarheid bij bestandsupload (CVE-2024-2221) die pas in v1.9.0 is opgelost. Als je Qdrant moet gebruiken, zorg dan dat je de nieuwste versie hebt.

Caution

Het open-source vector database ecosysteem is ruw. Vertrouw de documentatie niet. Ga ervan uit dat alles kapot is totdat het tegendeel bewezen is. Test lokaal voordat je je aan een stack commit.

Systeemvereisten

Node.js: v18.0.0+ (GitHub)
Ollama: Laatste versie (GitHub)
Model: mxbai-embed-large via Ollama
Vector Database: LanceDB (GitHub)
GitHub Toegang: @octokit/rest voor het scrapen van issues (GitHub)
SQLite: Voor primaire database (via mongoose-to-sqlite)

Cron Job Configuratie

Alle AI-taken draaien via cron op een MacBook M5. Zo stel je de cron jobs in om middernacht te draaien voor meerdere inboxen.

Omgevingsvariabelen

De taken vereisen deze omgevingsvariabelen. De meeste kunnen worden ingesteld in een .env bestand (geladen via @ladjs/env), maar HISTORY_SCAN_SINCE moet dynamisch worden berekend in de crontab.

In .env bestand:

# Forward Email API-gegevens (verschilt per inbox)
FORWARD_EMAIL_ALIAS_USERNAME=support@forwardemail.net
FORWARD_EMAIL_ALIAS_PASSWORD=your-imap-password

# PGP decryptie (gedeeld over alle inboxen)
GPG_SECURITY_KEY=/path/to/private-key.asc
GPG_SECURITY_PASSPHRASE=your-passphrase

# Historische scan configuratie
HISTORY_SCAN_LIMIT=1000

# LanceDB pad
LANCEDB_PATH=/path/to/lancedb

In crontab (dynamisch berekend):

# HISTORY_SCAN_SINCE moet inline in crontab worden gezet met shell datum berekening
# Kan niet in .env bestand omdat @ladjs/env geen shell commando's evalueert
HISTORY_SCAN_SINCE="$(date -v-1d +%Y-%m-%d)"  # macOS
HISTORY_SCAN_SINCE="$(date -d 'yesterday' +%Y-%m-%d)"  # Linux

Cron Jobs voor Meerdere Inboxen

Bewerk je crontab met crontab -e en voeg toe:

# Update kennisbank (draait één keer, gedeeld over alle inboxen)
0 0 * * * cd /path/to/forwardemail.net && LANCEDB_PATH="/path/to/lancedb" GPG_SECURITY_KEY="/path/to/key.asc" GPG_SECURITY_PASSPHRASE="pass" node jobs/customer-support-ai/update-knowledge-base.js >> /var/log/update-knowledge-base.log 2>&1

# Train vanuit geschiedenis - support@forwardemail.net
0 0 * * * cd /path/to/forwardemail.net && FORWARD_EMAIL_ALIAS_USERNAME="support@forwardemail.net" FORWARD_EMAIL_ALIAS_PASSWORD="support-password" HISTORY_SCAN_SINCE="$(date -v-1d +%Y-%m-%d)" HISTORY_SCAN_LIMIT=1000 GPG_SECURITY_KEY="/path/to/key.asc" GPG_SECURITY_PASSPHRASE="pass" LANCEDB_PATH="/path/to/lancedb" node jobs/customer-support-ai/train-from-history.js >> /var/log/train-support.log 2>&1

# Train vanuit geschiedenis - abuse@forwardemail.net
0 0 * * * cd /path/to/forwardemail.net && FORWARD_EMAIL_ALIAS_USERNAME="abuse@forwardemail.net" FORWARD_EMAIL_ALIAS_PASSWORD="abuse-password" HISTORY_SCAN_SINCE="$(date -v-1d +%Y-%m-%d)" HISTORY_SCAN_LIMIT=1000 GPG_SECURITY_KEY="/path/to/key.asc" GPG_SECURITY_PASSPHRASE="pass" LANCEDB_PATH="/path/to/lancedb" node jobs/customer-support-ai/train-from-history.js >> /var/log/train-abuse.log 2>&1

# Train vanuit geschiedenis - security@forwardemail.net
0 0 * * * cd /path/to/forwardemail.net && FORWARD_EMAIL_ALIAS_USERNAME="security@forwardemail.net" FORWARD_EMAIL_ALIAS_PASSWORD="security-password" HISTORY_SCAN_SINCE="$(date -v-1d +%Y-%m-%d)" HISTORY_SCAN_LIMIT=1000 GPG_SECURITY_KEY="/path/to/key.asc" GPG_SECURITY_PASSPHRASE="pass" LANCEDB_PATH="/path/to/lancedb" node jobs/customer-support-ai/train-from-history.js >> /var/log/train-security.log 2>&1

# Verwerk inbox - support@forwardemail.net
*/5 * * * * cd /path/to/forwardemail.net && FORWARD_EMAIL_ALIAS_USERNAME="support@forwardemail.net" FORWARD_EMAIL_ALIAS_PASSWORD="support-password" GPG_SECURITY_KEY="/path/to/key.asc" GPG_SECURITY_PASSPHRASE="pass" LANCEDB_PATH="/path/to/lancedb" node jobs/customer-support-ai/process-inbox.js >> /var/log/process-support.log 2>&1

# Verwerk inbox - abuse@forwardemail.net
*/5 * * * * cd /path/to/forwardemail.net && FORWARD_EMAIL_ALIAS_USERNAME="abuse@forwardemail.net" FORWARD_EMAIL_ALIAS_PASSWORD="abuse-password" GPG_SECURITY_KEY="/path/to/key.asc" GPG_SECURITY_PASSPHRASE="pass" LANCEDB_PATH="/path/to/lancedb" node jobs/customer-support-ai/process-inbox.js >> /var/log/process-abuse.log 2>&1

# Verwerk inbox - security@forwardemail.net
*/5 * * * * cd /path/to/forwardemail.net && FORWARD_EMAIL_ALIAS_USERNAME="security@forwardemail.net" FORWARD_EMAIL_ALIAS_PASSWORD="security-password" GPG_SECURITY_KEY="/path/to/key.asc" GPG_SECURITY_PASSPHRASE="pass" LANCEDB_PATH="/path/to/lancedb" node jobs/customer-support-ai/process-inbox.js >> /var/log/process-security.log 2>&1

Cron Schema Uitleg

Taak	Schema	Beschrijving
`train-from-sitemap.js`	`0 0 * * 0`	Wekelijks (zondag middernacht) - Haalt alle URL's uit sitemap en traint kennisbank
`train-from-history.js`	`0 0 * * *`	Dagelijks middernacht - Scant e-mails van de vorige dag per inbox
`process-inbox.js`	`/5 * * *`	Elke 5 minuten - Verwerkt nieuwe e-mails en genereert concepten

Dynamische Datum Berekening

De variabele HISTORY_SCAN_SINCE moet inline in de crontab worden berekend omdat:

.env bestanden worden gelezen als letterlijke strings door @ladjs/env
Shell commandosubstitutie $(...) werkt niet in .env bestanden
De datum elke keer dat cron draait vers berekend moet worden

Juiste aanpak (in crontab):

# macOS (BSD date)
HISTORY_SCAN_SINCE="$(date -v-1d +%Y-%m-%d)" node jobs/...

# Linux (GNU date)
HISTORY_SCAN_SINCE="$(date -d 'yesterday' +%Y-%m-%d)" node jobs/...

Onjuiste aanpak (werkt niet in .env):

# Dit wordt gelezen als letterlijke string "$(date -v-1d +%Y-%m-%d)"
# NIET geëvalueerd als shell commando
HISTORY_SCAN_SINCE=$(date -v-1d +%Y-%m-%d)

Dit zorgt ervoor dat elke nachtelijke run de datum van de vorige dag dynamisch berekent, waardoor overbodig werk wordt vermeden.

Eerste Setup: URL-lijst Extractie uit Sitemap

Voordat je de process-inbox taak voor het eerst draait, moet je de URL-lijst uit de sitemap extraheren. Dit maakt een woordenboek van geldige URL's waar de LLM naar kan verwijzen en voorkomt URL-hallucinaties.

# Eerste setup: URL-lijst extraheren uit sitemap
cd /path/to/forwardemail.net
node jobs/customer-support-ai/train-from-sitemap.js

Wat dit doet:

Haalt alle URL's op van https://forwardemail.net/sitemap.xml
Filtert alleen niet-geolokaliseerde URL's of /en/ URL's (voorkomt dubbele content)
Verwijdert locale prefixen (/en/faq → /faq)
Slaat een eenvoudige JSON-bestand met de URL-lijst op in $LANCEDB_PATH/valid-urls.json
Geen crawling, geen metadata scraping - alleen een platte lijst van geldige URL's

Waarom dit belangrijk is:

Voorkomt dat de LLM nep-URL's hallucineert zoals /dashboard of /login
Biedt een whitelist van geldige URL's waar de response generator naar kan verwijzen
Simpel, snel en vereist geen vector database opslag
De response generator laadt deze lijst bij opstarten en neemt het mee in de prompt

Toevoegen aan crontab voor wekelijkse updates:

# URL-lijst extraheren uit sitemap - wekelijks op zondag middernacht
0 0 * * 0 cd /path/to/forwardemail.net && node jobs/customer-support-ai/train-from-sitemap.js >> /var/log/train-sitemap.log 2>&1

Cron Taken Handmatig Testen

Om een taak te testen voordat je deze aan cron toevoegt:

# Test sitemap training
cd /path/to/forwardemail.net
export LANCEDB_PATH="/path/to/lancedb"
node jobs/customer-support-ai/train-from-sitemap.js

# Test support inbox training
cd /path/to/forwardemail.net
export FORWARD_EMAIL_ALIAS_USERNAME="support@forwardemail.net"
export FORWARD_EMAIL_ALIAS_PASSWORD="support-password"
export HISTORY_SCAN_SINCE="$(date -v-1d +%Y-%m-%d)"
export HISTORY_SCAN_LIMIT=1000
export GPG_SECURITY_KEY="/path/to/key.asc"
export GPG_SECURITY_PASSPHRASE="pass"
export LANCEDB_PATH="/path/to/lancedb"
node jobs/customer-support-ai/train-from-history.js

Logs Monitoren

Elke taak logt naar een apart bestand voor eenvoudige debugging:

# Support inbox verwerking realtime bekijken
tail -f /var/log/process-support.log

# Laatste nachtelijke training run controleren
cat /var/log/train-support.log | grep "$(date -v-1d +%Y-%m-%d)"

# Alle fouten over taken heen bekijken
grep -i error /var/log/train-*.log /var/log/process-*.log

Tip

Gebruik aparte logbestanden per inbox om problemen te isoleren. Als één inbox authenticatieproblemen heeft, vervuilt dat de logs van andere inboxen niet.

Codevoorbeelden

Scrapen en Verwerken

// jobs/customer-support-ai/update-knowledge-base.js
const scraper = new Scraper();
const processor = new Processor();
const ollamaClient = new OllamaClient();
const vectorStore = new VectorStore();

// Oude data wissen
await vectorStore.clear();

// Alle bronnen scrapen
const documents = await scraper.scrapeAll();
console.log(`Gescrapete ${documents.length} documenten`);

// Verwerken in stukken
const allChunks = [];
for (const doc of documents) {
  const chunks = processor.processDocuments([doc]);
  allChunks.push(...chunks);
}
console.log(`Gegenereerd ${allChunks.length} stukken`);

// Embeddings genereren en opslaan
const texts = allChunks.map(chunk => chunk.text);
const embeddings = await ollamaClient.generateEmbeddings(texts);

for (let i = 0; i < allChunks.length; i++) {
  await vectorStore.addDocument(texts[i], {
    ...allChunks[i].metadata,
    embedding: embeddings[i]
  });
}

Trainen vanuit Historische E-mails

// jobs/customer-support-ai/train-from-history.js
const scanner = new EmailScanner({
  forwardEmailApiBase: config.forwardEmailApiBase,
  forwardEmailAliasUsername: config.forwardEmailAliasUsername,
  forwardEmailAliasPassword: config.forwardEmailAliasPassword
});

const vectorStore = new VectorStore({
  collectionName: 'customer_support_history'
});

// Alle mappen scannen (INBOX, Verzonden, etc.)
const messages = await scanner.scanAllFolders({
  limit: 1000,
  since: new Date('2024-01-01'),
  decryptPGP: true
});

// Groeperen in conversatiedraden
const threads = scanner.groupIntoThreads(messages);

// Elke draad verwerken
for (const thread of threads) {
  const context = scanner.extractConversationContext(thread);

  for (const message of context.messages) {
    // Versleutelde berichten overslaan die niet ontcijferd konden worden
    if (message.encrypted && !message.decrypted) continue;

    // Gebruik reeds geparseerde inhoud van nodemailer
    const text = message.nodemailer?.text || '';
    if (!text.trim()) continue;

    // Tekst opdelen en opslaan
    const chunks = processor.chunkText(`Onderwerp: ${message.subject}\n\n${text}`, {
      chunkSize: 1000,
      chunkOverlap: 200
    });

    for (const chunk of chunks) {
      await vectorStore.addDocument(chunk.text, {
        type: 'historical_email',
        folder: message.folder,
        subject: message.subject,
        date: message.nodemailer?.date || message.created_at,
        messageId: message.id,
        threadId: context.subject,
        encrypted: message.encrypted || false,
        decrypted: message.decrypted || false,
        ...chunk.metadata
      });
    }
  }
}

Context Opvragen

// jobs/customer-support-ai/process-inbox.js
const vectorStore = new VectorStore();
const historyVectorStore = new VectorStore({
  collectionName: 'customer_support_history'
});

// Beide stores bevragen
const knowledgeContext = await vectorStore.query(emailEmbedding, { limit: 8 });
const historyContext = await historyVectorStore.query(emailEmbedding, { limit: 3 });

// Gewogen rangschikking en deduplicatie vinden hier plaats
const rankedContext = rankAndDeduplicateContext(knowledgeContext, historyContext);

// Antwoord genereren
const response = await responseGenerator.generate(email, rankedContext);

De Toekomst: Spam Scanner R&D

Dit hele project was niet alleen voor klantenservice. Het was R&D. We kunnen nu alles wat we geleerd hebben over lokale embeddings, vector stores en context retrieval toepassen op ons volgende grote project: de LLM-laag voor Spam Scanner. Dezelfde principes van privacy, zelf-hosting en semantisch begrip zullen hierbij cruciaal zijn.

Problemen Oplossen

Vector Dimensie Mismatch Fout

Fout:

Error: Failed to execute query stream: GenericFailure, Invalid input, No vector column found to match with the query vector dimension: 1024

Oorzaak: Deze fout treedt op wanneer je van embeddingmodel wisselt (bijv. van mistral-small naar mxbai-embed-large), maar de bestaande LanceDB-database is aangemaakt met een andere vectordimensie. Oplossing: Je moet de kennisbank opnieuw trainen met het nieuwe embedding-model:

# 1. Stop alle lopende customer support AI-taken
pkill -f customer-support-ai

# 2. Verwijder de bestaande LanceDB-database
rm -rf ~/.local/share/lancedb/forward_email_knowledge_base.lance
rm -rf ~/.local/share/lancedb/customer_support_history.lance

# 3. Controleer of het embedding-model correct is ingesteld in .env
grep OLLAMA_EMBEDDING_MODEL .env
# Zou moeten tonen: OLLAMA_EMBEDDING_MODEL=mxbai-embed-large

# 4. Haal het embedding-model binnen in Ollama
ollama pull mxbai-embed-large

# 5. Train de kennisbank opnieuw
node jobs/customer-support-ai/train-from-history.js

# 6. Herstart de process-inbox taak via Bree
# De taak wordt automatisch elke 5 minuten uitgevoerd

Waarom dit gebeurt: Verschillende embedding-modellen produceren vectoren met verschillende dimensies:

mistral-small: 1024 dimensies
mxbai-embed-large: 1024 dimensies
nomic-embed-text: 768 dimensies
all-minilm: 384 dimensies

LanceDB slaat de vectordimensie op in het tabelschema. Wanneer je een query uitvoert met een andere dimensie, faalt het. De enige oplossing is om de database opnieuw aan te maken met het nieuwe model.

Lege Kennisbank Context

Symptoom:

debug     Retrieved knowledge base context {
  total: 0,
  afterRanking: 0,
  questionType: 'capability'
}

Oorzaak: De kennisbank is nog niet getraind, of de LanceDB-tabel bestaat niet.

Oplossing: Voer de trainingstaak uit om de kennisbank te vullen:

# Train vanaf historische e-mails
node jobs/customer-support-ai/train-from-history.js

# Of train vanaf website/docs (als je een scraper hebt)
node jobs/customer-support-ai/train-from-website.js

PGP Ontsleutelingsfouten

Symptoom: Berichten worden als versleuteld weergegeven, maar de inhoud is leeg.

Oplossing:

Controleer of het GPG-sleutelpad correct is ingesteld:

grep GPG_SECURITY_KEY .env
# Zou moeten wijzen naar je privé-sleutelbestand

Test de ontsleuteling handmatig:

node -e "const decrypt = require('./helpers/customer-support-ai/pgp-decrypt'); decrypt.testDecryption();"

Controleer de machtigingen van de sleutel:

ls -la /path/to/your/gpg-key.asc
# Moet leesbaar zijn voor de gebruiker die de taak uitvoert

Gebruikstips

Inbox Zero Bereiken

Het systeem is ontworpen om je automatisch te helpen inbox zero te bereiken:

Automatisch Archiveren: Wanneer een concept succesvol is aangemaakt, wordt het originele bericht automatisch verplaatst naar de Archief-map. Dit houdt je inbox schoon zonder handmatige tussenkomst.
Concepten Controleren: Controleer regelmatig de Concepten-map om AI-gegenereerde antwoorden te bekijken. Bewerk indien nodig voordat je ze verzendt.
Handmatige Override: Voor berichten die speciale aandacht nodig hebben, voeg je eenvoudig het label skip-ai toe voordat de taak draait.

Het skip-ai Label Gebruiken

Om AI-verwerking voor specifieke berichten te voorkomen:

Voeg het label toe: Voeg in je e-mailclient een skip-ai label/tag toe aan elk bericht (hoofdletterongevoelig)
Bericht blijft in inbox: Het bericht wordt niet verwerkt of gearchiveerd
Handmatig afhandelen: Je kunt er zelf op reageren zonder AI-inmenging

Wanneer skip-ai gebruiken:

Gevoelige of vertrouwelijke berichten
Complexe gevallen die menselijke beoordeling vereisen
Berichten van VIP-klanten
Juridische of compliance-gerelateerde vragen
Berichten die onmiddellijke menselijke aandacht nodig hebben

E-mail Threading en Reply-All

Het systeem volgt standaard e-mailconventies:

Geciteerde Originele Berichten:

Hi there,

[AI-generated response]

--
Thank you,
Forward Email
https://forwardemail.net

On Mon, Jan 15, 2024, 3:45 PM John Doe <john@example.com> wrote:
> This is the original message
> with each line quoted
> using the standard "> " prefix

Reply-To Afhandeling:

Als het originele bericht een Reply-To header heeft, antwoordt het concept naar dat adres
Het originele From-adres wordt toegevoegd aan CC
Alle andere originele To- en CC-ontvangers blijven behouden

Voorbeeld:

Origineel bericht:
  From: john@company.com
  Reply-To: support@company.com
  To: support@forwardemail.net
  CC: manager@company.com

Conceptantwoord:
  To: support@company.com (van Reply-To)
  CC: john@company.com, manager@company.com

Monitoring en Onderhoud

Controleer regelmatig de kwaliteit van concepten:

# Bekijk recente concepten
tail -f /var/log/process-support.log | grep "Draft created"

Monitor archivering:

# Controleer op archiveringsfouten
grep "archive message" /var/log/process-*.log

Bekijk overgeslagen berichten:

# Zie welke berichten zijn overgeslagen
grep "skip-ai label" /var/log/process-*.log

Testen

Het klantenservice AI-systeem bevat uitgebreide testdekking met 23 Ava-tests.

Tests uitvoeren

Vanwege npm-pakket override conflicten met better-sqlite3, gebruik het meegeleverde testscript:

# Voer alle klantenservice AI-tests uit
./scripts/test-customer-support-ai.sh

# Voer uit met gedetailleerde output
./scripts/test-customer-support-ai.sh --verbose

# Voer een specifiek testbestand uit
./scripts/test-customer-support-ai.sh test/customer-support-ai/message-utils.js

Alternatief, voer tests direct uit:

NODE_ENV=test node node_modules/.pnpm/ava@5.3.1/node_modules/ava/entrypoints/cli.mjs test/customer-support-ai

Testdekking

Sitemap Fetcher (6 tests):

Locale patroon regex matching
URL-pad extractie en locale verwijderen
URL-filterlogica voor locales
XML parsing logica
Deduplicatie logica
Gecombineerde filtering, verwijderen en deduplicatie

Message Utils (9 tests):

Afzendertekst extraheren met naam en e-mail
Alleen e-mail afhandelen wanneer naam overeenkomt met prefix
Gebruik from.text indien beschikbaar
Gebruik Reply-To indien aanwezig
Gebruik From als geen Reply-To
Inclusief originele CC-ontvangers
Sluit ons eigen adres uit CC uit
Afhandelen van Reply-To met From in CC
Deduplicate CC-adressen

Response Generator (8 tests):

URL-groeperingslogica voor prompt
Afzendernaam detectielogica
Promptstructuur bevat alle vereiste secties
URL-lijst formattering zonder hoekige haken
Afhandeling van lege URL-lijst
Verboden URL-lijst in prompt
Historische context opname
Correcte URL's voor account-gerelateerde onderwerpen

Testomgeving

Tests gebruiken .env.test voor configuratie. De testomgeving bevat:

Mock PayPal- en Stripe-gegevens
Test encryptiesleutels
Uitgeschakelde authenticatieproviders
Veilige testdatapaden

Alle tests zijn ontworpen om te draaien zonder externe afhankelijkheden of netwerkverbindingen.

Belangrijkste Leerpunten

Privacy eerst: Zelf hosten is ononderhandelbaar voor GDPR/DPA-naleving.
Kosten zijn belangrijk: Cloud AI-diensten zijn 50-1000x duurder dan zelf hosten voor productie workloads.
Het ecosysteem is kapot: De meeste vector databases zijn niet ontwikkelaarsvriendelijk. Test alles lokaal.
Beveiligingslekken zijn reëel: ChromaDB en Qdrant hadden kritieke RCE-kwetsbaarheden.
LanceDB werkt: Het is embedded, serverless en vereist geen apart proces.
Ollama is solide: Lokale LLM-inferentie met mxbai-embed-large werkt goed voor onze use case.
Type mismatches zijn dodelijk: text vs. content, ObjectID vs. string. Deze bugs zijn stil en meedogenloos.
Gewogen ranking is belangrijk: Niet alle context is gelijk. FAQ > GitHub issues > Historische e-mails.
Historische context is goud waard: Training met oude support e-mails verbetert de responskwaliteit drastisch.
PGP-decryptie is essentieel: Veel support e-mails zijn versleuteld; correcte decryptie is cruciaal voor training.

Leer meer over Forward Email en onze privacy-first benadering van e-mail op forwardemail.net.