
NeorunBase 주요 기능
관계형, JSONB, 벡터 데이터베이스, 풀텍스트 검색, 그래프 데이터베이스, 공간 데이터를 하나의 분산 ACID 엔진에서 처리하는 PostgreSQL 호환 멀티모달 Lakebase. Pinecone · Elasticsearch · Neo4j 를 따로 운영하지 않고 한 SQL 안에서 결합합니다.
PostgreSQL 와이어 호환
psql · JDBC · pgAdmin · LangChain · pgvector 클라이언트가 코드 수정 없이 그대로 붙습니다. PostgreSQL 마이그레이션 부담 없이 분산 환경으로 이행할 수 있습니다.
분산 ACID + 자동 복구
해시 기반 샤딩과 무중단 리샤딩, ZooKeeper sticky leader 선출, 디스크/노드 장애 자동 복구, 2PC 분산 트랜잭션. RocksDB 위에서 ACID 보장.
한 SQL 안의 멀티모달
관계형 · 벡터 · 풀텍스트 · 그래프 · 공간 데이터를 하나의 ACID SQL 안에서 결합합니다. Hard Filter (WHERE) + 시맨틱/키워드 하이브리드 검색 + 그래프 기반 재순위화를 한 SELECT 으로 표현하므로 별도 데이터스토어 · 글루 ETL 이 필요 없습니다.
벡터 데이터베이스 (pgvector 호환)
pgvector 호환 VECTOR 타입 + <-> · <#> · <=> 거리 연산자, 분산 HNSW ANN 인덱스. 트랜잭션 데이터 · 메타 · 임베딩이 같은 ACID 트랜잭션 안에 있어 RAG 백엔드로 즉시 사용 가능합니다.
풀텍스트 (Lucene BM25)
Lucene 기반 BM25 인버티드 인덱스, PostgreSQL FTS 호환 문법(@@, ts_rank), 다국어 형태소 분석기. 벡터 ANN 과 결합한 하이브리드 검색을 HYBRID_SEARCH(...) TVF 한 줄로 표현합니다.
그래프 데이터베이스 + 분석
엣지 테이블 위에서 BFS 트래버설(GRAPH_NEIGHBORS), PageRank · Personalized PageRank, 다중-홉 도달 가능성 검증(GRAPH_PATH_EXISTS) 을 SQL TVF 로 제공합니다. CSR 가속 레이어로 단일-홉 100x+ 빠른 응답, 단일 SELECT 안에서 하이브리드 검색 결과를 그래프 점수로 재순위화하는 Graph RAG 패턴이 자연스럽게 표현됩니다.
공간 데이터 (PostGIS 호환)
ST_Distance · ST_Contains 등 PostGIS 호환 공간 함수와 Z-order 공간 인덱싱. 위치 기반 서비스 · GIS · 지리 RAG 모두 한 엔진에서.
Iceberg CDC + Kafka 인입
OLTP 테이블 변경을 Iceberg/Parquet로 자동 CDC 동기화 — Ontul 이 Iceberg 카탈로그를 통해 같은 데이터를 SQL로 분석합니다. Kafka 컨슈머 직접 통합 + REST 대량 인입 + MERGE/Upsert.
엔터프라이즈 보안 + 통합 콘솔
AES-256-GCM 봉투 암호화(데이터 · WAL · 메타), 내장 KMS + 키 로테이션, IAM/RBAC + STS, pgwire TLS. React 기반 웹 콘솔과 Prometheus 메트릭으로 클러스터 · 샤드 · IAM · Iceberg · Kafka 를 한 곳에서.
활용 사례
Graph RAG · 에이전트 retrieval
Hard Filter (SQL WHERE) + 시맨틱/키워드 하이브리드 검색 + 그래프 기반 재순위화 + 사실 검증을 한 SELECT 으로. 시스템 4종(Postgres + Pinecone + ES + Neo4j) 을 묶지 않고 한 데이터베이스에서 RAG · 에이전트 retrieval 을 처리합니다.
지식 그래프 · 온톨로지 저장소
엔티티와 관계를 일반 테이블로 모델링하고 BFS 트래버설 + PageRank · Personalized PageRank 로 분석합니다. 별도 그래프 DB 운영 없이 RBAC · 트랜잭션 · 백업이 그대로 적용됩니다.
OLTP + 분석의 통합
OLTP 트랜잭션을 Iceberg 로 자동 CDC 동기화해 Ontul · Trino · Spark 가 같은 데이터를 분석합니다. 별도 ETL · CDC 파이프라인이 필요 없습니다.
대규모 분산 DB · 실시간 인입
수평 샤딩 + 자동 밸런싱 + Kafka 직결 인입으로 페타바이트급 트랜잭션 워크로드를 분산 처리합니다.
위치 기반 · 지리 RAG
PostGIS 호환 공간 함수와 벡터 임베딩을 결합해 위치 기반 추천 · GIS · 지리 RAG 를 단일 엔진에서.
