Rodrigo Rodriguez (Pragmatismo) b680301c38 - More general docs.

2025-11-23 13:46:55 -03:00

6.7 KiB

Raw Blame History

Knowledge Base

BotServer's knowledge base system enables semantic search and retrieval of documents, providing context for intelligent bot responses.

Overview

The knowledge base system provides:

Document storage and indexing
Vector embeddings for semantic search
Integration with Qdrant vector database
Multi-collection management
Context retrieval for LLM augmentation

Architecture

Storage Layers

Drive (S3-compatible) Storage - Raw document files
PostgreSQL - Document metadata and references
Qdrant - Vector embeddings for semantic search

Database Schema

kb_collections Table

Stores knowledge base collections:

Collection ID and name
Bot association
Description and metadata
Creation/update timestamps

kb_documents Table

Individual documents within collections:

Document ID
Collection reference
Content (text)
Metadata (JSON)
Embedding ID (Qdrant reference)
Indexed flag

user_kb_associations Table

Links sessions to active knowledge bases:

Session ID
Collection ID
Activation timestamp

Document Organization

Collection Structure

bot-name.gbai/
└── bot-name.gbkb/
    ├── policies/
    │   ├── vacation-policy.pdf
    │   └── code-of-conduct.pdf
    ├── procedures/
    │   └── onboarding.docx
    └── faqs/
        └── common-questions.txt

Supported Formats

PDF documents
Text files (.txt, .md)
Word documents (.docx)
CSV files
JSON files
HTML documents

BASIC Keywords

USE_KB

Activate a knowledge base collection:

USE_KB "policies"
USE_KB "procedures"

# Now LLM has access to these collections
let answer = LLM "What's the vacation policy?"

CLEAR_KB

Remove knowledge bases from context:

CLEAR_KB "policies"  # Remove specific
CLEAR_KB             # Clear all

ADD_KB (Implicit)

Documents in .gbkb folders are automatically:

Uploaded to drive storage
Indexed into Qdrant
Available for USE_KB

Indexing Process

Document Processing Pipeline

Upload: Files uploaded to drive bucket
Extraction: Text extracted from documents
Chunking: Documents split into segments
Embedding: Generate vector embeddings
Storage: Store in Qdrant with metadata
Registration: Update PostgreSQL references

Chunking Strategy

Documents are chunked for optimal retrieval:

Chunk size: ~500 tokens
Overlap: 50 tokens
Maintains context boundaries
Preserves paragraph integrity

Embedding Generation

Using OpenAI or local models:

Model: text-embedding-ada-002 (OpenAI)
Dimension: 1536 (OpenAI) or varies (local)
Batch processing for efficiency

Qdrant Integration

Vector Storage

Embeddings stored in Qdrant:

Collection per bot
Metadata includes:
- Document ID
- Chunk index
- Source file
- Creation date

Semantic Search

Query process:

Convert query to embedding
Search Qdrant for similar vectors
Retrieve top-k results
Return document chunks
Include in LLM context

Search Parameters

Top-k results: 5 (default)
Similarity threshold: 0.7
Distance metric: Cosine similarity

Context Management

Context Assembly

When answering questions:

Retrieve relevant documents
Order by relevance score
Truncate to context limit
Prepend to user query
Send to LLM

Context Limits

Managing token constraints:

Maximum context: 4000 tokens
Document chunks: 500 tokens each
Reserve tokens for conversation
Automatic truncation

Usage Examples

Customer Support Bot

# Load knowledge bases
USE_KB "product-docs"
USE_KB "support-faqs"
USE_KB "troubleshooting"

# Answer customer question
let question = HEAR
let answer = LLM "Answer based on our documentation: " + question
TALK answer

Policy Assistant

# Load company policies
USE_KB "hr-policies"
USE_KB "compliance"

# Interactive Q&A
TALK "I can answer questions about company policies."
let query = HEAR
let response = LLM "Based on company policy: " + query
TALK response

Research Assistant

# Load research papers
USE_KB "research-papers"
USE_KB "citations"

# Summarize findings
let topic = HEAR
let summary = LLM "Summarize research on: " + topic
TALK summary

Performance Optimization

Caching

Embedding cache for repeated queries
Document cache in cache component
Search result caching
Metadata caching

Batch Operations

Bulk document upload
Batch embedding generation
Parallel indexing
Async processing

Index Management

Periodic reindexing
Orphan cleanup
Duplicate detection
Version control

Monitoring

Metrics

Documents indexed
Search queries per second
Average retrieval time
Cache hit rate
Storage usage

Health Checks

Qdrant connectivity
Index consistency
Document accessibility
Embedding quality

Best Practices

Organize Collections: Group related documents
Quality Content: Ensure documents are accurate
Regular Updates: Keep knowledge current
Monitor Usage: Track which documents are accessed
Optimize Chunks: Tune chunk size for your content
Cache Effectively: Cache frequently accessed documents
Clean Data: Remove outdated information

Limitations

Document size limits (varies by format)
Indexing time for large collections
Context window constraints
Language support (primarily English)
No real-time document updates

Troubleshooting

Common Issues

Documents Not Found
- Check indexing completed
- Verify collection name
- Ensure USE_KB called
Poor Search Results
- Review document quality
- Adjust chunk size
- Check embedding model
Slow Retrieval
- Optimize Qdrant queries
- Increase cache size
- Reduce result count
Context Too Long
- Reduce top-k results
- Smaller chunk size
- Prioritize relevance

Configuration

Environment Variables

# Qdrant Configuration
QDRANT_URL=http://localhost:6333
QDRANT_API_KEY=optional-api-key

# Embedding Configuration
EMBEDDING_MODEL=text-embedding-ada-002
EMBEDDING_DIMENSION=1536

# Search Configuration
SEARCH_TOP_K=5
SEARCH_THRESHOLD=0.7

Future Enhancements

Planned improvements:

Multi-modal search (images)
Real-time indexing
Advanced chunking strategies
Cross-lingual support
Document versioning
Incremental updates
Custom embedding models

Summary

The knowledge base system is fundamental to BotServer's intelligence, enabling bots to access and retrieve relevant information from document collections. Through integration with Qdrant and semantic search, bots can provide accurate, context-aware responses based on organizational knowledge.

6.7 KiB Raw Blame History