빅데이타와 빅시그널의 차이
------------------------------------------------------------------------------------
우리가 사용하는 기본적인 데이터는 상상하기에 볼 수 있는 현실적인 외형을 꼽는다면 엑셀스프레드시트에 나열된 난수표 또는 시간 및 공간 등에 관한 결과들일 것이다 그러나 엑셀은 연산하고 저장하기에 최대한계가 있는 데이터 창고이고 그 보다 많은 수의 데이터 모음을 ‘빅데이터, big data)’라고 하며 그 데이터를 운용하고 계산하는 S/W도 별도로 있다. 그런데 인공지능의 결과물을 위한 연료로 사용되는 빅데이타와 빅시그널은 구분해야한다. 그 차이를 생각해 보았는가?
Big data & Big signal
빅데이타는 인구, 교통, 날씨, 경제, 사고, 재난, 역사 등의 자료를 모집한 큰 자료로서 통계적 흐름을 판단하고 최종적으로 결정적인 판단을 할 수 있는 용도로 사용되며 멀리는 인공지능에 요구되는 핵심적인 두뇌학습에 근간이 되는 경험자료로 볼 수도 있다. 그런데 ‘1/n초’단위로 흐르는 시간에 대한 물리량의 데이터(진동, 소음, 온도, 압력, 유량 등)도 빅데이타라고 불러야 할까?
많은 사람들, 심지어 인공지능 관련 과학자들도 잘 구분하기 어려운 것이 이 것이다. 이 물리량의 데이터는 통계적인 결과나 패턴의 흐름을 판단하기 위한 결정적인 자료로 활용하기에는 결과가 너무 순간이며 너무나도 벅찰 만큼 많다. 이 것은 빅데이타가 아닌 빅시그널(Big signal)로 불러야 한다고 생각한다. 우리는 이 빅시그널에서 원하는 결과를 얻을 수 있는 어떤 특징(Featuring)을 찾아야 하는데 그 특징은 어떤 구분자(패턴분석 또는 정량분석을 위한 경계설정, threshold)를 통한 개별적 결과들을 모두 모아서 비로소 저장하면 이 것을 ‘빅데이타’로 부른다. 이 것을 기본으로 탑재된 자동분석을 이용하는 것이 바로 인공지능이라 할 것이다.
즉, 다시 설명하면 인공지능은 빅데이타가 필요하며 빅데이타는 빅시그널을 분석한 결과들이고 빅시그널은 순간적인 디지털 물리량으로 설명하는 것이다. 이 것을 구분하는 이유는 간단하다. 이러한 빅사이즈 시그널은 특징을 분석하거나 구분자가 없으면 직접 빅데이타로 옮기지도 못하고 장기간 저장도 하지 못하며 쓸모가 없는 데이터인 단순한 시그널이기 때문이다.
요리하지 않은 재료는 먹을 수 없다는 것을 예를 들어 비교해 본다.
관련 Tag | PDM, 예지보전, 설비진단, 진동, 기계진단, 인공지능, 기계학습, 딥러닝, 빅데이타, 빅시그널 |
All copyright 한국CBM written by BISOPE , vs72@naver.com, 070-4388-0415, www.kCBM.kr