Configuration

textrawl is configured via environment variables in a .env file.

Environment Variables

Database Connection

Variable	Required	Description
`SUPABASE_URL`	Yes	Your Supabase project URL
`SUPABASE_SERVICE_KEY`	Yes	Service role key (bypasses RLS)

SUPABASE_URL=https://abcdefghijklmnop.supabase.co
SUPABASE_SERVICE_KEY=eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9...

Warning: Never commit your service key to version control. Use .env files or secret managers.

Embedding Provider

Choose between OpenAI (cloud) or Ollama (local):

Variable	Required	Description
`EMBEDDING_PROVIDER`	No	`openai` (default) or `ollama`
`OPENAI_API_KEY`	If OpenAI	Your OpenAI API key
`OLLAMA_BASE_URL`	If Ollama	Ollama server URL
`OLLAMA_MODEL`	If Ollama	Model name (default: `nomic-embed-text`)

OpenAI Configuration:

EMBEDDING_PROVIDER=openai
OPENAI_API_KEY=sk-proj-...

Model: text-embedding-3-small
Dimensions: 1536

Ollama Configuration:

EMBEDDING_PROVIDER=ollama
OLLAMA_BASE_URL=http://localhost:11434
OLLAMA_MODEL=nomic-embed-text

Dimensions: 1024

Important: OpenAI and Ollama use different embedding dimensions. You cannot mix providers without re-embedding all documents.

Server Configuration

Variable	Required	Default	Description
`PORT`	No	`3000`	Server port
`LOG_LEVEL`	No	`info`	`debug`, `info`, `warn`, `error`
`ALLOWED_ORIGINS`	No	`*`	CORS allowed origins (comma-separated)

PORT=3000
LOG_LEVEL=info
ALLOWED_ORIGINS=http://localhost:3000,https://myapp.com

Authentication

Variable	Required	Description
`API_BEARER_TOKEN`	Production	Auth token (min 32 characters)

API_BEARER_TOKEN=your-very-secure-token-with-at-least-32-characters

When set, all API endpoints require the Authorization: Bearer <token> header.

Unprotected endpoints (for health checks):

/health
/health/live
/health/ready

Web UI

Variable	Required	Default	Description
`UI_PORT`	No	`3001`	Web UI port for file conversion

UI_PORT=3001

Feature Flags

Variable	Required	Default	Description
`ENABLE_MEMORY`	No	`true`	Enable/disable memory tools
`ENABLE_CONVERSATIONS`	No	`true`	Enable/disable conversation memory tools
`ENABLE_INSIGHTS`	No	`true`	Enable/disable proactive insight tools
`ENABLE_MEMORY_EXTRACTION`	No	`false`	Enable LLM-based memory extraction
`COMPACT_RESPONSES`	No	`true`	Token-efficient response format

ENABLE_MEMORY=true
ENABLE_CONVERSATIONS=true
ENABLE_INSIGHTS=true
ENABLE_MEMORY_EXTRACTION=false
COMPACT_RESPONSES=true

Memory Extraction

Required only when ENABLE_MEMORY_EXTRACTION=true:

Variable	Required	Default	Description
`ANTHROPIC_API_KEY`	If extraction	-	Anthropic API key for Claude
`EXTRACTION_MODEL`	No	`claude-3-haiku-20240307`	Model for entity extraction

ENABLE_MEMORY_EXTRACTION=true
ANTHROPIC_API_KEY=sk-ant-...
EXTRACTION_MODEL=claude-3-haiku-20240307

Chunking

Variable	Required	Default	Description
`CHUNKING_MODE`	No	`fixed`	`fixed` or `semantic` (embedding-based topic splitting)
`SEMANTIC_SIMILARITY_THRESHOLD`	No	`0.5`	Threshold for semantic chunking (0-1)

CHUNKING_MODE=semantic
SEMANTIC_SIMILARITY_THRESHOLD=0.5

When COMPACT_RESPONSES=true (default), memory tools return token-efficient responses that reduce LLM context usage by 40-60%. This uses short keys like n, t, c instead of name, type, content.

Set COMPACT_RESPONSES=false for human-readable verbose responses during development or debugging.

See Response Format for the complete key mapping.

Rate Limiting

Variable	Required	Default	Description
`REDIS_URL`	No	-	Redis URL for shared rate limiting across instances (e.g. `redis://localhost:6379`)

REDIS_URL=redis://localhost:6379

When REDIS_URL is set, rate limit counters are shared across all server instances via Redis. Without it, each instance tracks limits independently in memory (fine for single-instance deployments).

Rate Limits

Built-in rate limiting:

Endpoint	Limit
API (`/mcp`, `/api/*`)	100 requests/minute
Upload (`/api/upload`)	10 requests/minute
Health (`/health/*`)	300 requests/minute

Example Configurations

Development (Local)

# .env
SUPABASE_URL=https://your-project.supabase.co
SUPABASE_SERVICE_KEY=your-service-key
OPENAI_API_KEY=sk-your-key
PORT=3000
LOG_LEVEL=debug

Production (Cloud Run)

# Set via Secret Manager
SUPABASE_URL=https://your-project.supabase.co
SUPABASE_SERVICE_KEY=your-service-key
OPENAI_API_KEY=sk-your-key
API_BEARER_TOKEN=your-secure-production-token
PORT=8080
LOG_LEVEL=info
ALLOWED_ORIGINS=https://your-frontend.com

Self-Hosted (Ollama)

# .env
SUPABASE_URL=postgresql://textrawl:textrawl@localhost:5432/textrawl
SUPABASE_SERVICE_KEY=not-used-for-local
EMBEDDING_PROVIDER=ollama
OLLAMA_BASE_URL=http://localhost:11434
OLLAMA_MODEL=nomic-embed-text
PORT=3000
LOG_LEVEL=info

Generating Secure Tokens

The setup script generates a secure token automatically:

pnpm setup

Or generate manually:

# macOS/Linux
openssl rand -base64 32
 
# Node.js
node -e "console.log(require('crypto').randomBytes(32).toString('base64'))"

Next Steps

Quick Start - Connect Claude Desktop
Security Hardening - Production security
Cloud Run Deployment - Deploy to GCP