한국주식분석

[종목분석] 비트나인 [4] (357880, KQ) 용어이해

bieni 2022. 1. 4. 18:09

사업개요를 알아보기 전에 용어에 대한 기본적인 이해가 필요하다.

(내용이 길어 읽기 싫으시다면, 형광펜 친 부분이라도 읽으시길 바랍니다.)

당연한 절차이다.

그래프 데이터베이스

여러 다양한 데이터베이스 중 하나로, 일반적으로 데이터를 점(노드)와 선(엣지)로 표현한다.

개체들간의 관계를 보다 직관적으로 파악할 수 있다.

이에 따른 성능이 기존의 관계형 데이터베이스보다 월등히 뛰어나다.

최근 가장 유행하는 데이터베이스이다.

출처: [알쓸IT잡] 그래프 데이터베이스란? (Graph Database) - Part.1 (tistory.com)

 

관계형 데이터베이스

가장 오래된 데이터베이스 중 하나로, 데이터를 테이블 형태로 표현하고 저장한다.
가장 정형화된 데이터 관리 기법을 제공한다.
대표적인 관계형 데이터베이스 회사로, 오라클, IBM, MS 등이 있다.
최근에는 테이블로만 데이터를 표현하는데 한계를 느낌으로서
테이블을 사용하지 않는 다양한 NoSQL 데이터베이스가 등장함

출처: Relational database terms - 관계형 데이터베이스 - 위키백과, 우리 모두의 백과사전 (wikipedia.org)

 

 

아파치 소프트웨어 재단


오픈소스 소프트웨어를 운영/지원하는 전세계 가장 큰 규모의 비영리 재단.

현재까지 약 370여개의 오픈소스 소프트웨어 프로젝트를 운영해왔고,

글로벌 대기업을 포함한 많은 유저들이 해당 소프트웨어를 사용하고 있음.


오픈소스 소프트웨어

기술공유의 관점에서 소스코드를 공유함으로써
더 빠른 기술개발을 일궈내자는 메세지가 포함된 소프트웨어


연단위 과금방식(Subscription)/일시불 구매방식(Perpetual)

신문구독과 같이 매월/매년 대금을 내는 방식이 있고,
일반적인 물건을 구매하듯 일시불 구매방식이 있음.

최근 다양한 금융상품들도 출시됨에 따라
자금의 효율적 관리를 위해
연단위 과금방식도 많이 선호하게 됨.


ETL: Extract / Transform / Load

데이터를 다른 형태로 활용하기 위한 과정

데이터를 추출(Extract)하고,
특정 사용에 맞게 변형(Transform)하여,
원하는 저장소에 저장(Load)하는 과정.

인터페이스

데이터베이스를 활용하기 위해서는 해당 데이터베이스와의 제대로된 소통이 필요하며,
이러한 소통을 원활하게 해주는 주변장치를 통틀어 인터페이스라고 함.


데이터 전처리

데이터를 제대로 활용하기 위해,
복잡한 형태의 원시(Source) 데이터에서 불필요한 부분은 제거하고
반드시 필요한 데이터만 취하는 일련의 과정

일반적으로 비정형 데이터는 데이트의 모양 자체가 매우 복잡하기 때문에,
이러한 데이터를 제대로 활용하기 위한 정형화 작업이 데이터 전처리 작업이라고 볼수 있음.

여담으로, 얼마 전까지 우리나라에 데이터는 넘치는데 쓸만한 데이터가 없다는 말이 나왔다.
데이터 분석도 활용하기 편한 상태로 가공되어야 하는데
데이터 전처리가 안된 자료는 있으나 마나이다.
구슬이 서 말이라도 꿰어야 보배


PostgreSQL


전세계적으로 가장 유명한 오픈소스 관계형 데이터베이스.
약 40년의 역사를 지닌 데이터베이스 제품임.
사용에 있어서 라이선스가 100% 무료.
많은 소프트웨어 회사들이 PostgreSQL 기반의 다양한 제품개발을 진행하고 있음


SQL

Standard Query Language의 약자.
데이터베이스 내에서 사용되는 별도의 데이터베이스 표준 언어임.
주로 관계형 데이터베이스들이 이러한 SQL을 많이 활용.
각각의 제조사들이 SQL 기반으로 일부 변형된 형태의 SQL을 만들기도 함.(예시. 오라클의 PL/SQL 등)

Cypher


그래프 데이터베이스 Query Language중 하나.
Neo4j, AgensGraph, Redis Graph 등이 사용하고 있음.
opencypher라는 오픈소스 재단에서 cypher를 관리하고 있다.
추후에는 GQL(Graph Query Language)로 통합될 예정임.


LDBC

Linked Data Benchmark Council의 약자.
Graph Data에 대한 표준을 정의하고, Graph Processing 기술을 연구하는 비영리 집단.
주로 그래프 프로세싱과 관련한 성능에 대한 데이터를 제공함.
2년전 비트나인에서도 LDBC 표준을 기반으로 성능비교를 진행함.


Neo4j


그래프 데이터베이스 업계 1위 업체.
글로벌에서는 그래프 데이터베이스로서 그 인지도가 가장 높다.
아직 한국에서는 지사가 없는 상황.
비상장 회사이고, 최근 시리즈 F 투자받음.


2022/1/4 환율 기준으로 약 24조원의 투자금액을 볼 수 있다.


Meta Data

데이터의 구조를 설명해주는 데이터로, 속성정보라고도 함.
대량의 데이터에서 원하는 데이터를 찾기 위해
이러한 속성정보를 활용하면 좀더 빠르고 정확한 데이터 탐색이 가능함.

Master Data

자주 변하지 않고 자료 처리 운용에 기본 자료로 제공되는 자료의 집합.
마스터 파일의 내용을 뜻하기도 한다.
예를 들면, 인사 데이터에서 이름, 생년월일, 급여, 주소, 혈액형 등이 포함될 수 있음

MySQL

PostgreSQL과 더불이 가장 많이 사용되는 오픈소스 관계형 데이터베이스중 하나.
2008년 Sun Microsystem이 MySQL을 인수하였다.
2009년 오라클이 Sun Microsystem을 인수함에 따라,
현재는 오라클이 관리하고 있는 오픈소스 관계형 데이터베이스임

 

NLP: Natural Language Processing


우리말로는 자연어 처리.
자연어 처리는 인공지능 기술중 핵심으로서,
결국 언어를 시스템이 이해함으로써 소통이 가능하게 하고
이를 기반으로 인공지능이 가능하게 됨

지식그래프

지식 데이터는 기존에 알고 있는 지식, 매뉴얼, 노하우 데이터의 집합이고,
이러한 데이터를 그래프 데이터화 하여 저장한것을 지식그래프라고 함.
지식그래프로 표현하게 되면, 다양한 지식들이 서로 연결이 됨으로써
보다 복잡한 형태의 지식도 인지할 수 있고,
또 그동안 몰랐던 정보에 대해서도 알수 있는 새로운 인사이트를 제공함

FDS : Fraud Detection System

 

HA : High Availability

우리말로는 고가용성.
일반적으로 IT 환경에서 단일 시스템을 사용하게 되면,
해당 시스템의 문제 발생시 빠르게 대응하여 조치가 필요한데,
이러한 빠른 조치를 위해 본 시스템이외에 예비시스템을 둠으로써,
본 시스템의 장애시 예비시스템을 바로 가동시키도록 고가용성을 유지함

NoSQL : Not Only SQL


SQL 그 이상의 query language를 의미함.
관계형 데이터베이스가 주로 SQL을 사용하고,
그래프 데이터베이스, Key Value 데이터베이스 등 다른 형태의 데이터베이스들이
주로 NoSQL을 사용함


대용량 그래프

보통 10억개 이상의 노드/엣지 형태의 그래프를 대용량 그래프라고 함.
대용량 그래프를 처리하기 위해서는
데이터베이스의 용량 및 성능이 뒷받침 되어야 처리가 가능함

On-Premise / Cloud


과거에는 기업들이 주로 IT 시스템들을
본인들이 소유한 전산실에 두고 운영을 해왔으나(On-Premise),

최근에는 본인들이 소유하지 않고
일정기간 과금방식으로 돈을 지불하여 해당시스템을 임대하여 사용함(Cloud)


ISV : Independent Software Vendor

 

독립 소프트웨어 개발 판매회사.
일반적으로 하나의 소프트웨어가 단독으로 모든 것을 처리하기 어렵기 때문에
ISV와 공동으로 작업을 수행함으로서 보다 많은 다양한 일을 처리할 수 있게됨.
따라서 많은 소프트웨어 회사들이 ISV 파트너들을 둠으로서
공동기술개발과 공동영업을 수행함으로써 비즈니스 시너지를 만들어내고자 함.

Apache AGE


비트나인이 개발한 AgensGraph 기반의 새로운 그래프 데이터베이스 엔진 제품.

Apache AGE는 2020년 4월 아파치 재단에 인큐베이팅 되었으며,

모든 관계형 데이터베이스에서 바로 사용이 가능한 그래프 확장모듈을 제공하는 것이 핵심 기술임.


Graph ML


그래프 머신러닝으로,
그래프 데이터를 머신러닝 방식으로 분석함으로써
Graph AI가 가능하게 하는 기술중 하나임.