
Ontul 주요 기능
배치 처리, 스트림 처리, 인터랙티브 SQL을 하나의 엔진으로 통합한 분산 데이터 엔진의 핵심 기능을 소개합니다.
통합 데이터 엔진
배치 처리, 스트림 처리, 인터랙티브 SQL 쿼리를 하나의 클러스터에서 실행합니다. 별도의 시스템 없이 모든 데이터 워크로드를 통합합니다.
Arrow 네이티브 실행 엔진
Apache Arrow 컬럼나 포맷으로 모든 데이터를 처리합니다. 벡터화 연산과 제로카피로 직렬화 오버헤드 없이 고성능을 실현합니다.
인터랙티브 SQL
Arrow Flight SQL을 통한 JDBC 연결(DBeaver, DataGrip)과 다중 카탈로그 페더레이션 쿼리를 지원합니다. JOIN, 윈도우 함수, CTE 등 표준 SQL을 완벽 지원합니다.
배치 & 스트리밍 처리
Java/Python SDK로 분산 배치 ETL 작업과 실시간 스트리밍 파이프라인을 실행합니다. Client 모드와 Server 모드를 지원합니다.
커넥터 아키텍처
플러그인 기반 커넥터로 다양한 데이터 소스에 접근합니다. Iceberg, JDBC, Kafka 등을 런타임에 동적으로 등록/해제할 수 있습니다.
페더레이션 쿼리
여러 데이터 소스에 걸친 크로스 카탈로그 조인을 단일 SQL로 실행합니다. Iceberg 테이블과 JDBC 데이터베이스를 하나의 쿼리로 결합합니다.
Apache Iceberg 통합
Iceberg REST 카탈로그 연동으로 읽기/쓰기, CTAS, MERGE INTO를 지원합니다. 스냅샷 만료, 데이터 컴팩션 등 자동 유지보수를 제공합니다.
보안 (IAM & KMS)
AES-256-GCM 봉투 암호화, 내장 KMS, 카탈로그/테이블/컬럼/행 수준 IAM 정책, STS 임시 자격 증명을 지원합니다.
활용 사례
통합 데이터 처리
별도의 배치/스트리밍/쿼리 클러스터 없이 하나의 Ontul 클러스터로 모든 데이터 워크로드를 처리합니다.
실시간 데이터 파이프라인
Kafka에서 데이터를 수집하여 Ontul에서 처리 후 Iceberg 테이블로 적재하는 실시간 ETL 파이프라인을 구축합니다.
데이터 레이크 분석
Iceberg, JDBC 등 다양한 소스에 걸친 페더레이션 쿼리로 통합 분석을 수행합니다.
ETL 자동화
SDK와 REST API로 배치 ETL 작업을 프로그래밍하고 워크플로우 오케스트레이터와 연동합니다.
