string(27) "/blog/?uid=150&mod=document"

HOME

ABOUT US

Blog

Blog

Blog

[Ark for CDC] Data Mapping 가이드

2021.02.17

다양한 산업 분야에서 데이터 통합은 데이터 기반의 새로운 비즈니스 인사이트를 제공하기 때문에 매우 매력적으로 다가온다. 실제로 병원의 경우 임상데이터웨어하우징(CDW) 구축을 통해서 현재 병원에서 발생하는 여러 상황을 실시간으로 모니터링함으로써 환자에게 더 질 높은 진료를 제공할 수 있다.

 

Ark for CDC 는 다양한 데이터맵핑 기반의 실시간 데이터 통합을 지원함으로써 기업 고객의 데이터 통합에 대한 요구를 충족시키며 비즈니스를 한층 더 강화할 수 있게 한다.

 

Data Mapping 은 데이터의 변형, 필터링을 위해 사용되는 기능으로 schema, object, column 단위의 mapping을 지원하며 아래와 같이 다양한 세부 기능을 지원한다.

 

20210217091717_arnqk3i.png 

 

1. Schema, Object Mapping

 

 - source schema.object to target schema.object 형태로 설정이 지원된다. 

 - 설정시에 *, suffix, prefix 가 지원된다

 - exclude 키워드로 mapping 대상 제외가 가능하다. 


2. Column Mapping 

 

- 단순 치환 형태로 설정가능 : source_col_name = target_col_name

- 형변환 : TONUM, TOSTR, TODATE, TOTIMESTAMP, TOINTERVALYM, TOINTERVALDS 함수 지원

- 필터링 : 데이터 적용 전 특정 조건에 대한 DML 작업만 수행하기 위해 사용되는 옵션으로 ONDELETE, ONUPDATE, ONINSERT 를 선택한 다음 다양한 키워드를 적용할 수 있음.

ex) filter(ONINSERT, ONUPDATE("ark_COL1_data" = "ArkData" && !(ark_COL2_data>= 100) && ark_COL3_data != 300 ΙΙ !range(ark_COL4_data*10, 1.1, 300) ) )

- where : ONDELETE, ONUPDATE 적용 시에 where에 설정된 값을 이용해 변환된 쿼리에 조건문을 추가할 수 있음.

ex) WHERE ( ONDELETE, ONUPDATE ( col1 >= 100 ) )

- changelog : Target Table 의 추가된 특정 컬럼에 flag, timestamp 를 입력할 수 있음

ex) CHGFLAG 인 경우 Insert "I", Update "U", Delete "D" 가 해당하는 컬럼의 데이터로 입력되며 ONDELETE의 경우 delete를 수행하지 않고 지정된 컬럼의 데이터를 변경하는 Update 문 수행

- key_columns : 특정 컬럼을 key 로 사용하기 위한 옵션으로 한 개의 컬럼, 혹은 여러개의 컬럼 지정이 가능함

- replace : 원본 데이터에서 설정된 특정 데이터로 변경하며 추출된 데이터 타입이 COL_TYPE_STRING, COL_TYPE_U_STRING, COL_TYPE_NUMBER인 경우 지원됨

ex) NUMBER type 인 경우 - replace (col_name, NUM(*, 5815)), replace(col_name, NUM(100, *100)), STRING type 인 경우 - STRSTR, STRTOK, STREXT, STRUPPER, STRLOWER, STRSUB 등 다양한 함수 지원