존재에 대한
섬찟할 만큼 아름다운 시선
김초엽 신작 장편소설

"나는 너의 일부가 될 거야.
너는 나를 기억하는 대신 감각할 거야.
사랑해. 그리고 이제 모든 걸 함께 잊어버리자.

그 애는 겨울에 도착한 불청객이었다.

반년 전, 그 애가 여기 맡겨질 거라는 소식을 들을 때까지만 해도 선오는 조금 들떠 있었다.

델마 할머니는 곤란한 표정을 하고는, "참 어쩌면 좋아. 얘야, 저 아이도 너와 비슷한 일을 당했다는데 둘이 마음이 통하는 부분이 있지 않겠니?" 하고 선오에게 속삭였다.

델마 할머니가 물고 온 소문에 따르면 이제프라는 사람은 얼마 전 지상으로 떠나버린 파견자였고, 몇 년 뒤에야 지하 도시로 돌아올 수 있을 거라고 했다. 그러니까,  그애는 버려진 것이다. 선오는 그렇게 이해했다.

나는 너의 일부가 될 거야. 어떤 기억은 뇌가 아니라 몸에 새겨질 거야. 너는 나를 기억하는 대신 감각할 거야.

사랑해. 그리고 이제 모든 걸 함께 잊어버리자.

자스완이 ‘애정을 담아’ 손수 만들었다고 주장하지만 언제나 그렇듯 부적절한 맛이 나는 굴라시였다. 시험을 앞둔 태린의 기운을 죽여서 탈락하게 만들려는 음모가 아닐까 싶을 정도였다.

"바쁘다고. 그런 거 신경쓸 겨를이 없다고. 일생일대의 중요한 시험이 눈앞에 다가와 있다고! 내 인생을 바꿀 시험이."

"열네 살 때였다면 그렇겠지."

"지금은 아니야?"

"지금도…… 그래, 솔직히 궁금하긴 해. 나도 네가 말한 그 진동, 느꼈으니까. 조사해보는 건 네 맘이지. 그렇지만 난 안 돼. 지금 난 내 인생을 좌지우지할 시험이 더 흥미롭거든."

태린의 법적 보호자이자 어린 태린과 선오를 혼자 키워낸 ‘아버지’인 자스완은 원래 유능한 파견자였다고 한다. 동생과 관련된 명령 때문에 상부에 강경하게 맞서는 바람에 파면되기 전까지는 말이다. 동생의 죽음도 파견 본부와 관련되어 있었다. 태린이 선오와 하라판을 돌아다니며 수집한 정보에 따르면 그랬다. 자스완은 절대 파견자 시절의 이야기를 들려주지 않았으니까.

"내가 시험 준비하다가 미쳐버렸단 거야?"

"어, 꼭 미친 사람들만 환청을 듣는 건 아니야. 나도 듣는데."

자아가 해체되고 자신이 이 현실에 있다는 것을 ‘깜빡’ 잊어버리는, 꿈과 현실을 분간하지 못하는…… 그러다 결국 미쳐버리고, 사나워지고, 때로 끔찍한 일을 벌이기도 하겠지. 언제까지 여자는 기계들로부터 숨을 수 있을까? 주위 사람들을 해치지 않는다고 확신할 수 있을까? 설령 숨는 데 성공한다고 해도 그 끝이 멀쩡하긴 할까?

파견자를 꿈꾸는 이들은 오직 파견자에게만 주어지는 것들을 갈망했다. 명예나 부, 은퇴 이후에 오는 안정적인 삶이든, 혹은 지상을 밟을 특권 그 자체이든. 파견자가 되기로 이미 결심한 이들에게 그 외의 것들이 눈에 들어올 리는 없었다.

"파견자는 매료와 증오를 동시에 품고 나아가는 직업입니다. 무언가를 끔찍하게 사랑하면서도, 동시에 불태워버리고 싶을 만큼 증오해야 합니다. 그걸 견딜 수 있는 사람만이 파견자가 될 수 있을 겁니다."

"최선을 다하세요. 뛰어난 동료로서 만날 수 있다면 얼마든지 환영이니까. 못하겠다면, 그냥 더 나은 길을 찾아봅시다."

"무슨 헛소리야? 거긴 아무도 안 살아!"

문을 열고 방 안으로 들어오자마자 태린은 벽에다 귀를 붙이고, 옆방에서 어떤 소리가 들려오는지 들어보았다.

벽 너머에는 정적뿐이었다.

—지상은 아름다운 곳이 아니야. 위험한 곳이지. 모두가 그곳에 갈 이유는 없어.

그때 태린은 무슨 생각을 했더라. 위험하더라도 지상을 보고 싶다고, 미지의 세계에 가보고 싶다고 생각했던가.

원하면 원할수록 지표면은 손 아래에서 닳아갔다. 태린은 끊임없이 생각했다. 나는 지상으로 가고 싶은 것일까. 지상을 얻고 싶은 것일까. 아니면 그 지상을 쫓는 사람을 갈망하는 것일까.

"난 발현자들을 많이 봐왔어. 범람체에 의한 광증은 확실히 달라. 그건 자아가 해체되는 과정이야. 자신이 지금 어디에 있는지, 또 누구인지 잊어버리지. 자신의 몸과 정신을 스스로의 것으로 인식하지 못하고, 결국은 과거와 현재를, 자전적 서사를 잃어버리는 거야. 환각이나 환청도 일부 증상이긴 하지만 넌 그 경우와 달라."


댓글(0) 먼댓글(0) 좋아요(3)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 

天長地久 追夢人

讓青春吹動了 你的長髮 讓它牽引你的夢

청춘이 흩날려버린 그대의 긴 머리는 그대의 꿈을 이끌어오고


不知不覺這城市的歷史已 記取了你的笑容

어느덧 이 도시의 역사는 이미 그대의 미소를 기억하고 있네요.


紅紅心中藍藍的天 是個生命的開始

뜨거운 마음 속 파란 하늘은 생명의 시작이죠.


春雨不眠隔夜的你 曾空獨眠的日子

봄비가 내리고 잠 못 이룬 채 밤을 지샌 그대만이 홀로 남겨졌네요.


讓青春嬌豔的花朵 綻開了深藏的紅顏

청춘의 요염한 꽃들은 깊이 감췄던 아름다운 얼굴을 피게 하네요.


飛去飛來的滿天的飛絮 是幻想你的笑臉

흩날리는 온 세상의 버들꽃솜처럼 웃는 그대의 얼굴은 환상 같죠.


秋來春去紅塵中 誰在宿命裡安排

가을이 오면 봄이 가는 속세에서 누가 숙명을 정해놓았을까요?


冰雪不語寒夜的你 那難隱藏的光彩

얼음처럼 차가운 겨울밤에도 숨기기 힘든 그대의 광채


看我看一眼吧 莫讓紅顏守空枕

한번만 나를 봐 줘요. 아름다운 얼굴로 빈 베개를 지키지 않게.(혼자이지 않게)


青春無悔不死 永遠的愛人

청춘이 후회 없이 사라지지 않게 영원히 사랑하고 싶은 그대여.


讓流浪的足跡在荒漠裡 寫下永久的回憶

방랑하는 발자국은 황량한 사막에서 영원한 추억을 남기게 하죠.


飄去飄來的筆跡是 深藏的激情你的心語

흩날리듯 썼던 필적은 감춰둔 그대의 격정적인 마음속 이야기였어요.


前塵後世輪迴中 誰在聲音裡徘徊(원가사 : 谁在宿命里徘徊)

전생과 후생이란 윤회 속에서 누구의 소리(숙명으)로 배회하고 있는건지.


癡情笑我凡俗的人 世終難解的關懷

치정이라 나를 비웃던 평범한 사람들도 끝끝내 풀 수 없는 관심사일 뿐이겠죠.


看我看一眼吧 莫讓紅顏守空枕

한번만 나를 봐 줘요. 아름다운 얼굴로 빈 베개를 지키지 않게.(독수공방 않게)


青春無悔不死 永遠的愛人

청춘이 후회 없이 사라지지 않게 영원히 사랑하고 싶은 그대여.


讓青春吹動了 你的長髮 讓它牽引你的夢

청춘이 흩날려버린 그대의 긴 머리는 그대의 꿈을 이끌어오고


不知不覺這城市的歷史已 記取了你的笑容

어느덧 이 도시의 역사는 이미 그대의 미소를 기억하고 있네요.


紅紅心中藍藍的天 是個生命的開始

뜨거운 마음 속 파란 하늘은 생명의 시작이죠.


春雨不眠隔夜的你 曾空獨眠的日子

봄비가 내리고 잠 못 이룬 채 밤을 지샌 그대만이 홀로 남겨졌네요.


春雨不眠隔夜的你 曾空獨眠的日子

봄비가 내리고 잠 못 이룬 채 밤을 지샌 그대만이 홀로 남겨졌네요.


댓글(0) 먼댓글(0) 좋아요(18)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 

빅데이터 분석을 통한 가치 창출을 처음 시도하는 기업이라면 반드시 1단계 묘사분석과 2단계 진단분석의 단계를 밟은 후에 3단계 예측분석이나 4단계 처방분석으로 가야 한다. 특히 4단계를 수행하려면 반드시 3단계에서의 예측이 필수적이다.

인공지능의 두 번째 구현 방법이 바로 이 귀납적 추론기반이다. 이것을 ‘머신러닝’ 또는 ‘기계학습’이라고 한다.

머신러닝은 인간이 자주 쉽게 수행하는 이 귀납적 추론 방법을 컴퓨터에게 시켜서 인공지능을 구현하는 것이다. 즉, 지식 기반과 달리 컴퓨터에게 명제를 주는 대신, 사진 같은 데이터를 여러 개 반복적으로 보여줌으로써 컴퓨터가 자연스럽게 의자를 인지하고 개와 고양이를 구분할 수 있게 만드는 것이다.

빅데이터는 어떠한 가치를 만들어내고 실제로 우리 삶을 어떻게 변화시키고 있는가? 기획, 이노베이션, 제품 개발부터 제조, 생산, 영업 및 마케팅, AS까지 기업에서 빅데이터가 어떻게 활용되는지 살펴보자. 실로 빅데이터는 개인의 취향과 욕망, 기계 장비 속에서 일어나는 일을 비롯해 우리 일상에서 벌어지는 모든 것을 알고 있다.

우버가 택시와 다른 점은, 기사가 목적지 때문에 승차 거부를 할 수는 없지만 해당 승객에 대한 다른 기사들의 평점을 보고 승차 거부를 할 수 있다는 것이다. 이로써 소위 ‘진상 고객’을 피할 수 있다. 평가 시스템에 의한 자동적인 자정인 셈이다.

우리에게 품질에 대한 정확한 수치를 92점, 91점 등으로 제공한다. 반면 지역 주민에게 물어보면 좋다고 해도 어느 정도로 좋은 건지 사람마다 그 기준이 다를 것이다. 인간의 언어는 애매모호하기 때문에 한 사람의 "꽤 좋다"가 다른 사람의 "아주 좋다"보다 더 좋을 수 있기 때문이다.

이렇게 하는 것이 머리에 띠 두르고 결의대회를 열어 ‘재작업 제로의 원년이 되자!’라는 구호를 외치거나, 화장실 변기 위에 표어를 붙여놓는 것보다 훨씬 효과적이다.

문제의 원인을 데이터로부터 찾아 이를 제거하는 액션을 취해야만 우리가 원하는 문제 해결, 즉 가치 창출을 할 수 있다. 아무리 작은 문제라도 이렇게 해서 제거한 문제는 절대로 재발되지 않는다.

장비의 이상 작동, 데이터로 간파하다

VIP는 돈이 많은 사람들이기 때문에 회비를 10만 원에서 9만 원으로 깎아주겠다는 것 정도에는 그다지 감동받지 않는다. 다만 감동받는 것은 바로 자신이 VIP라는 것을 ‘인정’받을 때다.

우리가 맛과 상관없이 단골집에 자주 가는 이유도 사실은 그런 인정받는 느낌 때문이다. 주인이 다른 손님과 다르게 나를 반기는 것을 좋아하는 것이다.

읽는 것을 안 좋아하는 아이는 아무리 집에 책을 많이 사다 놓아도 책 읽기 싫어하는 자기 엄마를 닮아서 절대로 책을 읽지 않는다

전 세계 모든 나라에는 중앙은행이라는 게 있다. 우리나라는 한국은행이, 일본은 일본은행이, 영국은 영국은행이 중앙은행이다. 유럽연합의 중앙은행은 유럽중앙은행이다. 다만 미국에는 중앙은행이 존재하지 않는다. 18세기에 중앙은행을 만들려는 대통령의 시도가 있었지만 자본가들에 의해 실패한 바 있다. 대신 미국은 연방준비제도federal reserve system라는 조금은 애매한 조직이 중앙은행 역할을 대체하고 있는데, 그곳 의장 임기는 몇 년밖에 되지 않아 벤 버냉키에서 재닛 옐런을 거쳐 지금은 제롬 파월이 맡고 있다.

알파고의 등장으로 인공지능과 빅데이터의 가치에 대한 인식이 많이 바뀌었다. 세상을 움직이는 인공지능과 데이터의 위력을 모두 알게 된 것이다. 이제 빅데이터를 인사이트로 변환시키는 애널리틱스는 무엇인지, 그 가운데 인공지능과 머신러닝은 무엇인지 살펴보자.

시각화, 우선 그림으로 그려야 한다
이제 애널리틱스 태스크에 대해 구체적으로 살펴보겠다. 먼저 시각화다. 시각화는 비즈니스 인텔리전스business intelligence라고도 하는데, 데이터를 그림으로 그려서 보여주는 것이다.

맥주와 기저귀의 연관성은?
두 번째 분석 태스크는 연관분석, 즉 연관성이 있는 것들을 찾는 것이다.

비슷한 것은 비슷한 것끼리 모아야
세 번째 태스크는 클러스터링, 즉 군집화다. 사람 또는 대상을 비슷한 것들끼리 묶는 방법이다.

비행기도 새가 되는 ‘튜링 테스트’
위키피디아에 따르면, 인공지능이란 주변 상황을 인지하고 목표를 달성하는 행동을 하는 컴퓨터로 정의된다.

암묵적 지식은 명제화가 불가능하다
기호주의로 다시 돌아가면, 이들 학파는 현실적인 한계를 세 가지나 만나게 되었다. 첫째는 지식의 방대함이다.

두 번째 현실적 한계는 전문가들의 지식 자체가 비일관적이고 주관적이라는 것이다.

세 번째 한계이자 가장 강력한 한계는 암묵적 지식tacit knowledge, 암묵지에 대한 것이다. 우리가 할 줄은 알지만 어떠한 지식을 이용해서 하는지 체계적으로 설명할 수 없는 것을 암묵적 지식이라고 한다. 반대 개념인 명시적 지식explicit knowledge, 명시지는 공학 지식, 법률 지식, 의학 지식 등으로 결론에 이르는 과정이 명백하고 각 단계에서 사용한 지식이 분명한 것들이다.

인간지능을 따라 만든 인공지능
인공지능 구현의 두 번째 방법은 첫 번째 기호주의와는 극단적으로 다르다. 인간의 뇌는 지능이 있으니 이것이 어떻게 운용되는지 보고 따라서 해보자는 생각에서 출발했다. 인간지능을 따라 하는 인공지능인 셈이다.

얼마 되지 않은 데이터로 무언가를 단정 짓듯 말하는 것은 매우 위험하다. 때마침 데이터의 양이 어마어마해진 빅데이터 시대에 귀납적 추론은 그 어느 때보다도 확실히 경쟁력이 있다고 하겠다.

그런데 1990년대 초중반까지 엄청난 전성기를 누리던 연결주의는 결정적인 현실 문제에 부닥치면서 두 번째 겨울을 맞게 된다. 첫 번째 문제는, 연결주의 지식의 핵심은 데이터에서 오는 것인데 이론적으로 머신러닝하는 알고리즘은 개발되었지만 정작 데이터가 없다는 것이다.

두 번째 이유는 컴퓨터의 계산 속도였다.

단어의 속성tag이 무엇인지 판단하는 과정을 태깅tagging이라고 한다.

빅브라더는 조지 오웰의 소설 『1984』에 등장하는 전체주의 정부를 가리키는 말로서, 정보를 독점해서 사회를 통제하는 권력이나 사회체계를 뜻한다. 그런데 사실상 빅브라더는 빅데이터가 등장하기 훨씬 전부터 존재했다. 지금은 붕괴된 동독과 소련을 포함한 공산국가 대부분이 그와 같은 정보 독점을 통해 사회를 통제했던 것이다.

4차 산업혁명의 재료로써 엄청난 가치를 만들어내는 빅데이터. 이러한 가치를 만들기 위해 구체적으로 누가 어떤 역할을 수행해야 하고 어떤 순서로 일을 진행해야 하는가? 이 과정에서 기관이나 기업이 마주치는 걸림돌은 무엇이며 이를 어떻게 극복할 수 있는가? 실제 데이터를 제공해주는 개개인은 그 혁신의 과실을 따먹을 수 있는가? 이를 위해 어떠한 제도적 장치가 필요한가?

정리해보면 빅데이터 가치를 만드는 과정은 기획plan, 분석do, 확인check, 실행act의 총 4단계로 이루어진다. 기획은 가치→인사이트→데이터 순으로 계획을 만드는 단계, 분석은 데이터로 인사이트를 만드는 단계, 확인은 인사이트의 의미를 검증하는 단계, 끝으로 실행은 인사이트를 비즈니스 가치로 만드는 단계다. 실행이 끝나면 다시 새로운 기획이 자연스럽게 떠오르게 됨으로써 4단계는 반복된다.

좋은 기획은 수많은 브레인스토밍을 거쳐야 한다
기획을 잘하려면 어떤 점에 집중해야 하는가? 성공적인 기획의 3요소는 첫째 임팩트, 둘째 데이터, 셋째 분석이다. 따라서 무엇보다 가장 먼저 비즈니스 임팩트가 큰 가치를 찾아야 한다.

첫째, 기본 이론 및 알고리즘을 공부하고, 둘째, 실제 데이터를 가지고 컴퓨터를 활용해서 애널리틱스 방법론을 적용함으로써 인사이트를 도출하는 실습을 수행하며, 셋째, 비즈니스 문제 상황 및 원하는 가치가 주어졌을 때 어떻게 분석 문제로 변환시키는지 도상 훈련을 한다. 그리고 넷째, 각자의 업무 분야에서 중요한 가치를 줄 수 있는 가치-인사이트-데이터로 이어지는 기획을 수행한 후, 마지막 단계에서는 자신이 수립한 기획에 따라 실제 데이터를 확보하여 애널리틱스 방법으로 인사이트까지 도출하는 것이다.

공대생은 모두 코딩을 잘한다고 생각하지만 실제로 컴퓨터공학과나 산업공학과, 전기공학과 정도에서만 코딩을 배운다. 다른 학과 출신은 자신이 따로 독학하지 않았다면 코딩을 하지 못한다

수레바퀴를 바꾸는 것은 리더의 역할

공공데이터는 엄청난 가치의 무료 빅데이터
그렇다고 현실이 어둡기만 한 것은 아니다. 희망도 있다. 바로 공공데이터 활용이다. 공공데이터란 정부나 공공기관이 보유한 데이터를 말하는데 우리 정부는 수년 전부터 민간에서 사용할 수 있도록 데이터를 개방하고 있다. 공공데이터 포털(data.go.kr)에 가면 다양한 정부 데이터들이 개방돼 있다.

빅데이터 활성화를 위해서는 제도적 지원도 필요하다. 어디까지가 합법이고 어디까지가 불법인지에 대한 분명한 가이드라인, 그리고 이를 뒷받침하는 사회적 합의가 그것이다. 우리나라에는 개인정보보호법이 있는데 주로 유럽의 법률을 참조해서 만들었다. 유럽은 개인정보를 인권으로 바라보고 기본적으로 공개를 금하고 있다. 그렇다 보니 우리나라 개인정보보호법의 규제 강도는 세계에서 두 번째로 강했다.

네이버, 카톡, 구글, 페이스북, 인스타그램 모두가 무료 서비스다. 이렇게 유용한 서비스를 우리에게 무료로 제공하는 회사들은 정말 천사같이 보인다. 그런데 사실 그 천사들은 무료의 대가로 우리의 매우 사적인 데이터를 가져간다. 만일 내가 누구와 대화하는지, 어떤 단어를 검색하는지, 어떤 사진을 찍었는지 아무에게도 알리고 싶지 않다면 위에 언급한 서비스를 사용하지 말아야 한다. 우리는 공짜로 서비스를 받는 대신 우리의 데이터를 건네주고 있다. 사실상의 암묵적인 거래가 발생하고 있는 것이다.

토지를 차지하려면 엄청난 비용을 지불하거나 혁명을 일으켜서 토지 개혁을 하는 방법밖에 없다. 그러나 데이터는 한정된 자원이 아니다. 돈이 많든 적든, 힘이 세든 약하든 누구에게나 데이터를 가질 수 있는 가능성이 열려 있다. 마치 신대륙이 생긴 것과 마찬가지다. 지금의 이 기회를 잘 활용하면 당신도 데이터의 주인이 되지 못할 이유가 없다. 내가 꿈꾸는 세상을 만드는 기획, 바로 우리 자신이 할 수 있는 것이다. 어떠한가, 여러분도 한번 도전해보고 싶지 않은가?


댓글(0) 먼댓글(0) 좋아요(3)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 

코스모스를 거대한 바다라고 생각한다면 지구의 표면은 곧 바닷가에 해당한다. ‘우주라는 바다‘에 대하여 우리가 알고 있는 것은 거의대부분 우리가 이 바닷가에 서서 스스로 보고 배워서 알아낸 것이다. - P37

코스모스는 너무 거대하여 우리가 통상 사용하는 길이 단위인 미터나 마일로는 도무지 그 크기를 가늠할 수 없다. 미터나 마일은 지상에서 쓰기에 편리하도록 고안된 단위일 뿐이다. 천문학에서는 그 대신빛의 빠른 속도를 이용하여 거리를 잰다. - P38

지구는 우주에서 결코 유일무이장소라고 할 수 없다. 그렇한다고 해서 우주 어디에서나 볼 수 있는 아주 전형적인 곳은 더더욱 아니다. 행성이나 별이나 은하를 전형적인 곳이라 할 수 없는 까닭은 코스모스의 대부분이 텅 빈 공간이기 때문이다. - P38

코스모스의 거시적 무늬, 지구에서 10억 광년 내에 있는 은하들 중에서 가장 밝은 것 100만 개만을 골라 늘어놓음으로써 은하 지도를 제작할 수 있었다. 그렇게 만든 지도의 일부를 여기에 옮겨 놓았다. 이 사진에 보이는 작은 정사각형 하나하나가 수십억 개의 별을 포함한 은하이다. 캘리포니아 대학교 리크 천문대 소속의 도널드 셰인DonaldShane과 칼 위르테닌Carl Wirtanen은 이 지도를 만들기 위해 12년 동안 전 하늘을 망원경으로 관측해야 했다. - P39

가. 그러나 현재까지 우리가 생명이 서식한다고 알고 있는 행성은 지구밖에 없다. 그렇지만 지구는 암석과 금속으로 이루어진 조그마한 바위덩어리에 불과하다. 간신히 태양 빛을 반사하고 있기에 조금만 멀리떨어져도 그 존재를 알아볼 수 없다. - P41

푸른색의 별은 뜨거운 젊은 별이고, 노란색의 별은 평범한 중년기의 별이다. 붉은 별은 나이가 들어 죽어 가는 별이며작고 하얀 별이나 검은 별은 아예 죽음의 문턱에 이른 별이다. - P43

이렇게 다양한 성격의 별들이 우리 은하 안에 4000억개 정도 있다. 이 별들이 복잡하면서도 질서정연하고  우아한 법칙에 따라 움직인다. 이 많은 별들 중에서 지구인들이 가까이 알고 지내는 별은, 적어도 아직까지는,
태양 하나뿐이다. - P43


댓글(0) 먼댓글(0) 좋아요(3)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 

산업공학이란? 産業工學, Industrial Engineering
산업 시스템을 구성하는 모든 분야를 조화롭게 조정하는 방법을 탐구하는 학문이다. 다른 공학 분야가 특정 산업의 전문적 기술이나 원리를 연구 개발하고 제공한다면, 산업공학은 과학적 원리와 경영 전략을 접목하여 기업 업무 과정을 혁신하고 체계화하며, 합리적인 방법을 도출하고 종합적 경영 전략을 운영하는 과학적 이론과 실무적 기법을 다룬다. 급변하는 기술 환경에서 복잡한 시스템의 개별 구성 요소에 대한 지식은 물론, 각 구성 요소를 효율적으로 통합하여 시스템 전체에 대한 각종 의사결정을 지원하고 필요한 시점에 효과적인 서비스를 제공하기 위해 시스템의 설계, 설치 및 개선에 관여한다.

데이터 사이언티스트(data scientist)
데이터를 분석해 인사이트를 도출하는 수리과학자로, 분석가라고 부르기도 한다. 많은 양의 데이터가 다양한 형태로 생성되는 오늘날에 더 중요해지고 있다. 대부분 통계학, 컴퓨터공학, 또는 산업공학을 전공한 사람들이다.

인사이트(insight)
사전적 의미로 흔히 ‘통찰력’이라고 풀이되지만, 이 책에서는 빅데이터를 통해 창출되는 지식을 의미한다. ‘안(in)’과 ‘보다(sight)’라는 의미가 결합된 단어로, ‘안을 본다’는 것은 엔지니어는 기계의 안을 보고 마케터는 소비자의 마음을 보고 의사는 환자의 몸속을 본다는 뜻이다. 이를 통해 한 단계 더 나은 의사결정을 하여 새롭거나 더 나은 가치를 만들 수 있다.

포사이트(foresight)
사전적 의미로 ‘예측’이라고 풀이된다. ‘앞(fore)’과 ‘보다(sight)’라는 의미가 결합된 단어로, ‘앞을 본다’는 뜻이다. 이 책에서는 빅데이터로부터 도출된 인사이트 가운데 특히 미래에 대한 부분을 포사이트라고 부른다.

애널리틱스(analytics)
빅데이터에서 인사이트를 도출할 때 사용하는 분석 방법이다. 크게 시각화, 연관분석, 클러스터링, 분류, 예측 등이 있고, 각각의 작업을 구현하는 방법론(알고리즘 또는 모델)은 수십, 수백 가지가 있다. 통계학, 머신러닝, 인공지능, 경영과학 분야에서 연구하고 있으며, 지금 이 순간에도 전 세계 데이터 사이언티스트들이 더 나은 새로운 방법을 계속 만들어내고 있다.

데이터마이닝(data mining)
애널리틱스 중 하나. 데이터 간의 관계, 패턴, 규칙 등을 찾아내고 모형화해 인사이트를 도출함으로써 사실에 근거한 객관적 의사결정을 가능하게 하는 일련의 계산 과정이다.

인공지능(AI, artificial intelligence)
주변 상황을 인지하고 목표 달성을 위해 계획이나 행동을 하는 컴퓨팅 기술. 인간이 시각과 청각 등으로 인지하는 형태의 데이터가 컴퓨터에 입력되면, 알파고처럼 바둑을 두고 자율주행 자동차처럼 운전을 할 수 있다.

머신러닝(machine learning)
인공지능을 구현하는 방법 중 하나. 기계학습이라고도 한다. 충분히 많은 양의 데이터를 반복적으로 컴퓨터에 입력하면, 컴퓨터가 데이터를 인지하고 학습하여 귀납적 추론을 가능하게 한다. 21세기 인공지능의 접근 방식이다.

신경망(neural network)
인간의 뇌는 약 1000억 개의 뉴런이 있고 각 뉴런은 약 7000개의 다른 뉴런과 시냅스로 연결되어 있는데, 우리가 무언가를 학습할 때 반복적 자극에 의해 시냅스의 연결이 강화된다. 신경망은 이 아이디어에서 착안해 컴퓨터 안에 뉴런과 시냅스로 구성된 뉴런의 망을 생성한 것으로, 데이터를 자극처럼 사용하여 운전이나 음성인식 같은 태스크를 할 수 있게 한다. 인공지능 혁명의 핵심 방법론인 딥러닝에서 복잡한 구조의 신경망을 사용한다.

최적화(optimization)
빅데이터를 분석하는 과정의 마지막 단계로, 빅데이터를 활용해 무엇이 왜 어떻게 일어나고 있는지 분석한 후 원하는 결과를 얻기 위해 무엇을 해야 하는지를 찾는 것이다. 고도의 수리와 계산 모델링을 포함한다. 경영과학 분야에서 오랫동안 연구 개발된 분야이다.

시각화(visualization)
데이터를 직관적으로 이해할 수 있게 그림으로 표현하는 애널리틱스의 주요 분야이자 첫 단계다. 확보한 빅데이터가 내가 생각하는 데이터인지 검증할 때도 사용한다. 또, 다른 애널리틱스 방법으로 도출한 인사이트를 의사결정자에게 제시할 때에도 사용된다.

빅데이터는 인공지능 시대를 움직이는 새로운 자원이자 화폐다.

인공지능은 컴퓨터가 빅데이터를 학습해서 지능적으로 행동하는 것이다.

따라서 빅데이터 없이 인공지능은 구현되지 못한다. 휘발유 없이 자동차가 움직이지 못하는 것과 같다. 그래서 데이터를 새로운 자원 또는 신新경제의 화폐라고도 한다.

빅데이터는 기계도 생성하지만 사실 우리 모두가 만들어내는 것이다. 휴대폰의 전원을 켜는 순간 우리의 위치 데이터가 생성되고, 통화와 문자 사용 내역이 데이터화되며, 차를 타서 내비게이션 앱을 켜는 순간부터 우리의 위치와 속도 데이터가 생성된다. 또한 주식 매매, 은행 입출금 모두가 데이터다.

빅데이터는 요리 재료다. 다양한 재료가 대량으로 존재한다. 손님(의사결정자)이 요리사(데이터 사이언티스트)에게 무슨 요리(인사이트)를 먹고 싶은지 이야기하면, 요리사가 필요한 재료를 확보하고 요리를 만든다. 만약 손님이 원하는 요리를 요리사에게 이야기해주지 않으면 요리사는 적당히 상상해서 만든다. 하지만 이런 요리로는 손님을 만족시킬 수 없다. 따라서 의사결정자는 원하는 인사이트를 데이터 사이언티스트에게 정확히 알려줘야 한다.

우리가 만드는 대량의 데이터
빅데이터의 특징은 우선 데이터의 양volume이 많다는 것이다. 그리고 실시간으로 발생하여 끊임없이 밀려들어오는 스트림 데이터stream data처럼 생성 속도velocity가 빠르며, 숫자와 같은 정형 데이터 이외에 텍스트, 이미지, 동영상 같은 비정형 데이터들이 다양하다variety는 것이다.

빅데이터는 이들 해당 영어 단어들의 첫 글자를 따서 ‘VVV’, 즉 3V라고도 한다.

빅데이터의 세 가지 특징을 차례로 살펴보자. 먼저 데이터의 양이다.

이 대량의 데이터는 주로 어디에서 많이 나오는가? 바로 우리의 일상생활에서 생성된다.

빅데이터의 생명은 ‘생성 속도’와 ‘다양성’
빅데이터의 두 번째 특징은 데이터의 생성 속도다.

빅데이터의 세 번째 특징은 데이터의 다양성이다.

마트에서 우리가 물건을 계산할 때 포인트 카드를 두고 왔더라도 휴대폰 번호만 제시하면 친절하게 포인트를 적립해주는 이유도 마찬가지다. 데이터가 아무리 많아도 이것들은 서로 연결돼야만 데이터로서의 가치를 갖는다. 구슬이 서 말이라도 꿰어야만 보배가 되는 것이다.

인도는 실제로 세계에서 가장 큰 홍채 데이터베이스를 가지고 있다. 문맹률이 높은 인도에서는 극빈자들에게 지급하는 정부 보조금을 중간에 누군가가 신분증을 도용해 대신 받아 가는 문제가 있었다. 이를 막기 위해 인도 정부가 나서 전 국민의 홍채 사진을 확보해 신분증에 넣었고, 홍채가 확인되어야만 보조금을 지급하도록 한 것이다.

정리하자면 "빅데이터는 양, 속도, 다양성이다"라는 말의 뜻은 이렇다. "데이터가 커도 괜찮아, 빨리 생성돼도 괜찮아, 다양한 데이터도 괜찮아, 난 뭐든지 할 수 있어!"라고 IT 전문가들이 외치는 것이다.

이제 우리는 새로운 관점을 가져야 한다. 양, 속도, 다양성의 관점이 아닌 비즈니스적인 관점에서 빅데이터를 볼 필요가 있다. 기업에서는 빅데이터로 어떻게 새로운 사업을 만들고, 고객과 소통하고, 매출을 늘리고, 비용을 줄이며, 직원들을 적재적소에 배치하고, 리스크를 최소화할지 깊이 고민해야 한다. 그리고 공공기관은 어떻게 국민들의 마음을 읽고, 비용 대비 효과가 높은 고효율 정책을 시행할 수 있을지 생각해야 한다.

4단계의 진행 방향을 보이는데, 첫 번째가 묘사분석, 두 번째가 진단분석, 세 번째가 예측분석, 네 번째가 처방분석이다. 즉 ‘도대체 무슨 일이 일어났는가 또는 일어나고 있는가’로부터 시작해서 ‘왜 그런 일이 일어났는가’로 이어지고 ‘앞으로 어떤 일이 일어날 것인가’, ‘그러면 우리는 어떻게 해야 하는가’로 나아간다. 과거의 상황 이해, 원인 이해, 미래 예측, 그리고 우리의 액션 플랜을 파악하는 순으로 나아간다.

우선, 지금 무슨 일이 일어나고 있는지 묘사할 것
이 도표를 기업에 적용해보면, 첫 번째 단계인 묘사descriptive는 가장 기본적인 지표로 과거에 일어난 일 그리고 지금 일어나고 있는 일을 정확하게 정리해서 보는 것이다.

진단과 예측, 데이터만한 것이 없다
두 번째 단계는 진단diagnostic이다. 1단계 묘사분석에서 찾아낸 인사이트에 대해 그 원인을 이해함으로써 한 단계 더 깊이 들어가고자 한다.

세 번째 단계는 예측predictive이다. 빅데이터 분석에서 가장 강력한 분석이다


댓글(0) 먼댓글(0) 좋아요(4)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo