Neo4j Vector Search Skill

Status: Draft / WIP — Content is a placeholder. Reference files to be added.

When to Use

Creating a vector index on a node property (embeddings)
Running vector similarity search (semantic/nearest-neighbor lookup)
Storing embeddings on graph nodes as part of an ingestion pipeline
Using the new SEARCH clause (Neo4j 2026.02.1+) or the legacy db.index.vector.queryNodes() procedure
Choosing similarity function (cosine vs euclidean) and embedding dimensions
Post-filtering vector results with graph traversal (but retrieval_query patterns → graphrag-skill)

When NOT to Use

GraphRAG pipelines (retrieval_query, HybridCypherRetriever) → use neo4j-graphrag-skill
Fulltext / keyword search (FULLTEXT INDEX, db.index.fulltext.queryNodes) → use neo4j-cypher-skill
GDS node embeddings (FastRP, Node2Vec) → use neo4j-gds-skill

Version Detection

-- Run this first to determine which syntax to use:
CALL dbms.components() YIELD versions RETURN versions[0] AS neo4j_version

Result	Syntax to use
`2026.02.1` or higher	`SEARCH` clause (in-index filtering supported)
`2025.x`	`db.index.vector.queryNodes()` procedure

Post-Creation Verification

After creating a vector index, always verify the config before ingesting data:

SHOW INDEXES YIELD name, state, indexConfig
WHERE name = 'chunk_embedding'
RETURN name, state, indexConfig;
-- state must be 'ONLINE'; check `vector.dimensions` matches your embedding model

Also validate at ingestion time:

expected_dim = 1536  # must match OPTIONS `vector.dimensions`
assert len(embedding) == expected_dim, \
    f"Embedding dimension mismatch: got {len(embedding)}, expected {expected_dim}"

Core Patterns

Create vector index

CYPHER 25
CREATE VECTOR INDEX chunk_embedding IF NOT EXISTS
FOR (c:Chunk) ON (c.embedding)
OPTIONS {
  indexConfig: {
    `vector.dimensions`: 1536,            -- match your embedding model output
    `vector.similarity_function`: 'cosine' -- or 'euclidean'
  }
}

Vector search — new SEARCH clause (2026.02.1+)

CYPHER 25
MATCH (c)
  SEARCH c IN (
    VECTOR INDEX chunk_embedding
    FOR $embedding
    WHERE c.source = $source        -- in-index metadata filter
    LIMIT 10
  ) SCORE AS score
RETURN c.text, score
ORDER BY score DESC

Vector search — legacy procedure (2025.x)

CYPHER 25
CALL db.index.vector.queryNodes('chunk_embedding', 10, $embedding)
YIELD node AS c, score
WHERE c.source = $source           -- post-filter (not in-index)
RETURN c.text, score
ORDER BY score DESC

Store embedding on ingest (Python)

from neo4j import GraphDatabase
from openai import OpenAI

openai = OpenAI()
driver = GraphDatabase.driver(uri, auth=(user, password))

def embed(text: str) -> list[float]:
    return openai.embeddings.create(
        model="text-embedding-3-small", input=text
    ).data[0].embedding

# Store chunk with embedding
driver.execute_query(
    "MERGE (c:Chunk {id: $id}) SET c.text = $text, c.embedding = $embedding",
    id="chunk-1", text="Alice works at Acme.", embedding=embed("Alice works at Acme.")
)

Embedding Dimension Reference

Provider / Model	Dimensions
OpenAI text-embedding-3-small	1536 (default) or 256–1536
OpenAI text-embedding-3-large	3072 (default) or 256–3072
OpenAI text-embedding-ada-002	1536
Voyage voyage-3-large	1024
Cohere embed-v3	1024
Google text-embedding-004	768
Ollama nomic-embed-text	768

Checklist

vector.dimensions matches the embedding model output dimension
Vector index created before ingesting embeddings
Similarity function chosen explicitly (cosine for normalized models; euclidean for unnormalized)
SEARCH clause used only on Neo4j 2026.02.1+; procedure fallback for 2025.x
Dimension mismatch will cause silent wrong results — verify index config after creation
All existing embeddings re-generated if model or dimension changes (index must be dropped and recreated)

neo4j-vector-search-skill

Neo4j Vector Search Skill

When to Use

When NOT to Use

Version Detection

Post-Creation Verification

Core Patterns

Create vector index

Vector search — new SEARCH clause (2026.02.1+)

Vector search — legacy procedure (2025.x)

Store embedding on ingest (Python)

Embedding Dimension Reference

Checklist

References