반응형

의미있는 데이터의 중요성...
데이터를 모으는것도 중요하지만 그것을 어떻게 활용할지가 더 중요하다는 생각을 한번 더 하게 되네요.
--------------------------------------------------------------------

개인적인 정보 또는 기업 데이터를 찾으면서 쓸데없는 일을 하고 있다는 생각을 한 적은 없나?


우리가 익히 알고 있는 IT의 가치가 중요한 기업 데이터를 찾아야 할 때는 아무짝에도 쓸모없는 무용지물처럼 느껴질 때가 종종 있다. 그러나 기업들은 데이터의 사용과 분석이 고도화될수록 자신들이 보관중인 데이터도 고도화된다고 생각한다. 이제 사용자가 원 데이터(raw data)에 액세스한다고 해서 원 데이터에 영향을 미치거나 하지는 않는다.

데이터는 누군가 사용하지 않으면 정보가 아니다. 그러나 정보도 이용할 수 있는 수단이 없으면 지식이라고 할 수 없다. 비트 코드를 가치 있고, 활용 가능한 비즈니스 정보로 전환하려면 정보에 대한 액세스보다 해당 정보가 의미 있는 정보여야 한다.

필자의 생각은 이렇다. 어느 도서관이든 서적의 형태로 풍부한 데이터가 보관돼 있지만 사용자가 필요로 하는 정확한 정보를 찾으려면 일정한 자격을 갖춘 연구원과 도서과학 전문가의 도움을 받아야 한다. 뿐만 아니라 찾고자 하는 정보가 원하는 포맷과 문맥에 맞게 정리돼 제공된다면 더 이상적이지 않을까? 또 이러한 정보를 거주 지역뿐 아니라 싱가포르, 밀란, 미네아폴리스, 코펜하겐 등 다른 도서관에서도 가져올 수 있다면?

정보 관리에 관한 몇 가지 새로운 접근방식을 보면 앞으로 무궁무진한 가능성이 열려있다는 사실을 알 수 있다.

아이튠을 설치하기 전에 디지털 음악을 수집하고, 정돈된 폴더에 가지런히 저장된 모든 파일을 통합하는 등 PC를 손봐야 했던 일이 얼마나 귀찮은 일이었나? 태깅(개인에 대한 부분)과 분류(기업 콘텐츠의 경우)는 의미 없는 사진에 의미를 부여하고, 오래된 고객 기록이나 데이터 파일이 중요성을 갖게 한다. 이러한 툴은 초기 리더들이다. 그리고 정보를 조직하고 액세스하는 등 우리의 정보 이용 방식을 대대적으로 변화시키는 신호다.

물론 우리가 데이터의 홍수 속에 묻혀있다는 등의 새로운 문제는 아니다. 하지만 더 많은 데이터가 기업 네트워크와 인터넷을 통해 쏟아져 나오기 시작한 최근 몇 년간 데이터가 기하급수적으로 증가한 것은 사실이다. IDG는 최근 이러한 현상을 ‘디지털 빅뱅’이라고 정의했다. 몇 가지 수치를 보면 그 이유를 알 수 있다. 지난해 1년 동안 생성, 캡처, 복사된 정보의 양은 161 엑사바이트(또는 1610억 기가바이트)에 달했다. 그러나 이 수치는 2010년까지 폭발적으로 증가해 약 998 엑사바이트에 이를 것으로 전망된다.

이러한 데이터는 대부분 독자 여러분과 필자 등 일반 개인들이 생성한 것들이다. IDC에 따르면 이들 데이터의 70%는 최종 사용자와 웹이 생산한다. 유튜브에서 발생하는 비디오 스트림은 하루 1억 건 이상, 매일 인터넷을 통해 공유되는 MP3 파일은 10억 건에 달한다. 더 편리해진 디지털 디바이스도 이 같은 폭발적인 데이터 증가에 한몫을 톡톡히 하고 있다. 일례로 지난해 카메라폰으로 촬영된 디지털 사진은 약 1,000억 건에 달했다.

온라인에 쏟아져 나오는 시청각 데이터가 증가하면서 이러한 데이터의 조직과 액세스에 대한 필요성도 커지고 있다. 여러분이 휴가 때 촬영한 사진을 신발상자에 넣어 다락방에서 끌어올리려 한다면 그 사진들의 의미는 퇴색할 것이다.

정보에 대한 액세스 수요가 증가하면서 새로운 플랫폼과 서비스가 출현하고 있다는 사실은 그리 놀랄만한 일이 아니다. 웹 2.0의 도래, 개방형 API, 오픈소스가 등장하면서 이 모든 것들이 가능해졌다. 그리고 유튜브 같은 서비스의 성공으로 간편한 정보 액세스가 더 주목받게 됐다. 유튜브가 등장하기 전에도 비디오는 온라인에 존재했지만 비디오를 조직해 개인 사이트를 일일이 방문하지 않고도 어디서나 액세스가 가능한 의미 있는 콘텐츠로 변화시킨 주인공은 유튜브다.

본격적인 싸움에 임하는 자세
데이터 액세스와 정보로의 전환에 대한 폭발적인 수요가 컴퓨터 산업 전반에 영향을 미치고 있다. 전 세계의 기업들은 절대적인 양을 차지하는 데이터와 데이터 관리를 위해 본격적인 싸움에 나섰다. 이제 기업의 수요는 “이 모든 데이터를 어떻게 저장할 것인가”가 아니라 “이 모든 데이터를 어떻게 관리할 것인가”로 옮겨가고 있다.

이로 인해 관련된 모든 기술이 정보 인프라스트럭처로 탄생하는 재미있는 상황이 벌어지고 있다. 이제 우리는 정보 가치 전달을 완전한 상태로 전보다 더 진보적으로 생각할 수 있게 됐다. 바로 웹 2.0과 정보 인프라스트럭처가 만나는 지점이다.

웹 2.0은 정보 전송 모델을 뒤죽박죽으로 만들어버린다. 이제는 정보 전송이 문제가 아니다. 글로벌 액세스와 우리 손가락 끝의 정보가 중요성을 갖는다. 정보가 어디에 존재하는지 사용자는 알 필요도 없다. 검색 조건을 기반으로 미디어, 비디오, 오디오, 이미지, 문서, 텍스트 등 다양한 포맷의 모든 정보가 사용자의 필요에 부합하는 방식으로 사용자와 실시간 애플리케이션으로 전송될 것이다.

이는 약속이다. 최종적으로 데이터의 잠금장치를 풀어 가치 있는 지식으로 전환할 수 있는 기회가 우리 앞에 놓여 있다. 왓슨과 크릭이 DNA 코드를 발견했을 때 한 가닥의 의미 없는 유전 명령을 무한한 정보를 갖는 이중 나선 구조로 변화시킨 것처럼 말이다.

효과적인 정보의 이용이 가능해지면 과거에는 조직화되지 않았던 데이터에 묻혀있던 숨겨진 통찰력이 모습을 드러낼 것이고, 이를 기반으로 더 많은 것들이 발견될 것이다.

완전히 새로운 세계가 우리 앞에 펼쳐지고 있다고 해도 좋다. 정보의 출처가 어디든 상관없이 정보를 조직하고 정보에 액세스하는 효과적인 방식을 찾아냄으로써 지식 노동자들의 사고와 업무 수행 방식에도 르네상스가 시작될 것이다. @

반응형

+ Recent posts