Data Discovery Tool MCP Server

Local setup required. This server has to be cloned and prepared on your machine before you register it in Claude Code.
1

Set the server up locally

Run this once to clone and prepare the server before adding it to Claude Code.

Run in terminal
git clone https://github.com/SofiaPurtova/data-discovery-tool
cd data-discovery-tool
pip install -r requirements.txt
pip install -e .
2

Register it in Claude Code

After the local setup is done, run this command to point Claude Code at the built server.

Run in terminal
claude mcp add data-discovery-tool -- python "<FULL_PATH_TO_DATA_DISCOVERY_TOOL>/dist/index.js"

Replace <FULL_PATH_TO_DATA_DISCOVERY_TOOL>/dist/index.js with the actual folder you prepared in step 1.

README.md

Enables AI agents to index and search across SQLite databases and CSV files.

Data Discovery Tool (MCP)

Инструмент для поиска данных в разных источниках (SQLite, CSV) через MCP API.

Возможности

  • Подключение к SQLite базам данных и CSV файлам
  • Индексация структуры таблиц и колонок
  • Поиск по названиям таблиц и колонок
  • MCP API для AI-агентов
  • CLI интерфейс с сохранением состояния
  • Веб-интерфейс на Flask

Установка

# Клонировать репозиторий
git clone https://github.com/yourusername/data-discovery-tool
cd data-discovery-tool

# Создать виртуальное окружение
python -m venv venv
# Windows:
venv\Scripts\activate
# Mac/Linux:
source venv/bin/activate

# Установить зависимости
pip install -r requirements.txt
pip install -e .

Использование

Создание тестовых данных

python create_test_data.py

Работа через командную строку

# Добавить SQLite базу данных
python ui/cli.py add-sqlite mydb data/sample.db

# Добавить папку с CSV файлами
python ui/cli.py add-csv mycsv data/

# Проиндексировать конкретный источник
python ui/cli.py index mydb
python ui/cli.py index mycsv

# Или все сразу (индексируем по очереди)
python ui/cli.py index mydb
python ui/cli.py index mycsv

# Поиск по ключевым словам
python ui/cli.py search user
python ui/cli.py search email
python ui/cli.py search product
python ui/cli.py search москва

# Список всех источников
python ui/cli.py sources

# Статистика системы
python ui/cli.py stats

# Схема конкретной таблицы
python ui/cli.py schema mydb users
python ui/cli.py schema mycsv employees.csv

# Подсказки для поиска
python ui/cli.py suggest user

Работа через веб-интерфейс

python ui/web.py

После запуска можно открыть браузер и перейти по адресу: http://localhost:5000

Возможности веб-интерфейса:
Поиск:
  • После введения ключевого слова и можно увидеть все совпадения
  • Подсветка результатов
  • Быстрый просмотр схемы таблиц
  • Количество найденных строк
Источники данных
  • Реализовано управление источниками через интерфейс
  • Просмотр всех добавленных источников
  • Статус индексации (индексирован, ожидает)
  • Кнопка для индексации
  • Информация о количестве таблиц
Схемы таблиц
  • Можно увидеть детальную информацию о структуре
  • Список всех колонок
  • Примеры значений

Автор

SofiaPurtova

Tools (3)

searchSearch for tables or columns across indexed data sources using keywords.
schemaRetrieve the structure and column metadata for a specific table.
indexIndex a specific data source to make it searchable.

Configuration

claude_desktop_config.json
{"mcpServers": {"data-discovery": {"command": "python", "args": ["/path/to/data-discovery-tool/ui/cli.py"]}}}

Try it

Search for tables related to 'users' across all my connected databases.
Show me the schema for the 'employees' table in the 'mycsv' data source.
Index the 'mydb' SQLite database so I can search its contents.
Find which table contains the 'email' column.

Frequently Asked Questions

What are the key features of Data Discovery Tool?

Connects to and indexes SQLite databases and CSV files. Keyword-based search for table and column names. Detailed schema exploration including column lists and sample values. Unified MCP API for AI-driven data discovery. Includes both CLI and Flask-based web interface.

What can I use Data Discovery Tool for?

Quickly locating specific data tables within large local database collections. Helping AI agents understand the structure of unfamiliar CSV datasets. Generating documentation for database schemas via natural language queries. Cross-referencing column names across multiple disparate data sources.

How do I install Data Discovery Tool?

Install Data Discovery Tool by running: git clone https://github.com/SofiaPurtova/data-discovery-tool && cd data-discovery-tool && pip install -r requirements.txt && pip install -e .

What MCP clients work with Data Discovery Tool?

Data Discovery Tool works with any MCP-compatible client including Claude Desktop, Claude Code, Cursor, and other editors with MCP support.

Turn this server into reusable context

Keep Data Discovery Tool docs, env vars, and workflow notes in Conare so your agent carries them across sessions.

Need the old visual installer? Open Conare IDE.
Open Conare