가령 객관식 시험 문제 같은 데서 자신이 기존에 갖고 있던 배경지식에 근거하여 올바른 접근법을 가지고 문제를 풀어 정답을 맞추는 경우도 있겠지만, 접근법같은 것과는 전혀 관계없이 오지선다 중에 그냥 아무 답이나 찍었는데도 답을 맞추는 경우가 있을 수 있다. 소위 말하는 운빨(?)이 따라준 경우다. 하지만 결과가 옳다고 해서 그 과정까지 옳았다는 섣부른 판단은 금물이라는 게 오늘 처음 밑줄친 부분의 교훈이다.

다만 이 책의 내용과는 별개로 세상은 항상 이성적인 논리로만 돌아가는 곳이 아니기에 이러한 운빨(?)이 어느정도는 작용한다고도 봐야할 듯하다. 물론 기본적으로 과학적이고 이성적인 사고가 일단 밑바탕에 깔려있어야 겠으나 운의 영역이라는도 결코 무시할 수는 없어보인다.

다시 본문으로 돌아와서 이 책에 자주 등장하는 확률이라는 개념은 이성적인 것과 비이성적인 것을 모두 고려한 어떤 가능성이라고도 볼 수 있기에 데이터에 기반한 의사결정이라는 것이 항상 옳다고 단정적으로 말할 수는 없지만, 그래도 가능성이 좀 더 높은 쪽을 생각하면서 상대적으로 가능성이 희박한 쪽에서 일어날 수 있는 일에도 대비하는 그런 자세와 태도가 필요하다는 생각이 든다.

지난번 포스팅에서도 잠시 언급했었지만 확률의 본질은 예측보다는 관리Management에 좀 더 가깝다.
.
.
.
오늘 포스팅의 후반부에서 저자가 예술 작품의 가치가 매겨지는 방식에 대한 간단한 공식을 적고 그에 대한 설명을 해주었는데, 개인적으로 상당부분 공감가는 내용이었다. 문학이든 미술이든 음악이든 분야를 막론하고 예술이라는 것의 자본주의 사회하에서의 가치는 그것의 인기와 그것의 지속시간에 따라 정해질거라는 저자의 말에 그냥 직관적인 느낌으로 고개가 끄덕여졌다. 혹여나 예술분야에 종사하시는 분들이 이러한 저자의 얘기에 동의하지 못하실 수도 있겠으나 여기서는 어떤 작품의 순수한 예술적 가치라기보다는 자본주의 사회에서 돈이 얼마나 되는가의 관점으로 보는 것이 좀 더 맞다고 보여진다.

곧바로 뒤이어지는 문장에서는 인쇄술로 인해 글쓰기의 가치가 사라졌고, 사진기로 인해 그림의 기술적 가치가 사라졌고, 축음기로 인해 음악의 가치도 사라졌다는 얘기가 나온다. 독자인 나는 처음엔 이게 무슨 궤변인가 싶었으나 문맥적 의미를 추론해보니 어떤 생각을 통해 창조된 새로운 활동이 아니라, 사람이 그냥 단순히 다른 글을 배껴쓰는 (과거의 필경사들이 했던 것과 비슷한) 글쓰기, 어떤 이미지를 단지 똑같이 배껴 그린 그림, 어떤 악기를 직접 연주하여 단순히 어떤 소리를 흉내내는 행위 같은 것들의 가치가 사라졌다는 의미였다. 다시 말해, 단순히 어떤 것을 흉내내는 정도의 예술은 가치가 별로 없다는 말로 난 이해했다. 만약 어떤 예술 행위가 결과물이 대중들에게 새로운 감동을 주는 방식으로 행해진다면 그것은 저자가 앞서 언급한 것들과는 다른 새로운 가치로 나타날 수 있을 것이라고 생각한다.
.
.
.
오늘 포스팅의 마지막 부분에서 저자는 요즘 가장 큰 이슈로 떠오른 챗GPT의 작동 원리에 대한 설명과 함께 이것이 가진 한계점에 대한 얘기를 덧붙인다. 핵심은 어떤 데이터가 챗GPT를 통해 학습되느냐에 따라 그것이 옳은 정보가 될 수도 혹은 그렇지 않을 수도 있다는 것이었다. 이를 통해 데이터의 진실성이 오히려 중요하다는 생각도 해볼 수 있었고, 다른 한편으로는 최근 사회문제로 인식되고 있는 이런저런 가짜 뉴스들에 대해서도 잠시나마 생각해볼 수 있었다. 온갖 가짜 뉴스들을 챗GPT같은 인공지능이 학습한다면 그것을 학습한 챗GPT에서 도출되는 결과물이라는 것도 결코 신뢰할 수 없는 지경에 이를 수 있는 것이다. 지금보다 좀 더 편해지고자 만들어낸 인공지능이 어쩌면 우리 삶의 근간을 완전히 송두리째 뒤흔들어 놓을수도 있는 것이다. 이 책에 직접적으로 나온 표현은 아니지만 ‘인공지능의 역습‘에 일방적으로 당하지 않기 위해서는 기술이 가져다주는 편리성 외에도 그 이면에 있는 위험성도 함께 고려할 수 있는 지혜가 필요하다는 생각이 들었다.

답이 맞았으니, 답을 찾는 접근법이 맞았다는 논리는 완전히 틀린 논리이다. - P165

숫자가(혹은 데이터가) 객관적일 수 없다...(중략)... 즉, 데이터가 동일하더라도, 상황에 따라 받아들이는 정도가 다르기 때문이다. 즉, 데이터 자체가 객관적이지 않다는 것이 아니라 숫자(데이터)를 인지하는 방법이 사람에 따라 달라지고 상황에 따라 달라진다는 뜻이다. 그리고 이러한 "상황"들은 사실 여부와 상관없이 얼마든지 감정적으로 극대화 될 수 있다. 이러한 이유로 무엇인가를 대변하는 데이터는 객관적일 수가 없다. - P170

왜 사람들은 상황에 따라 수를 인식하는 정도가 달라질까? 왜 서는 곳에 따라 풍경이 달라질수 밖에 없는가? 결론부터 이야기하자면, 인간은 기본적으로 편향된 생각(혹은 자신의 경험)을 기반으로 사실을(세상을) 인지하기 때문이다. - P170

세상은 크게 인지적 편향을 인식하는 자와 인식하지 못하는 자로 나뉘며, 이러한 편향을 인식한 자들 가운데서는, 이러한 편향을 이용하려는 자와 이용당하지 않으려는 자로 나뉜다고 봐도 된다. 그러면 인지적 편향을 이용하려는 자들은 누구인가? 이러한 부류의 대표 주자들은 정치인과 언론인이다. 그리고 정보를 독식하고 있는 부동산 중개인이나, 자동차 딜러, 자칭 전문가라는 가면을 쓰고 있는 펀드매니저, 미래를 내다볼 줄 안다는 예언가, 자기네 가게 물건이 싸다고 호객을 하는 점원 언니까지도 모두 이런 인지적 편향을 이용한다. 우리는 이미 알게 모르게 나의 인지적 편향을 이용하는 사람들 사이에 둘러싸여 있다. - P171

당신이 만약, 스스로 다른 이들 보다 인지적 편향에 대해서자유로울 수 있다고 장담한다면, 당신은 인지적 편향 자체를 인식하지 못하는 것일 뿐이다. - P172

아무리 데이터 리터러시를 외치고, 데이터의 객관성을 외친다 해도 스스로 인지적 편향성을 인식하지 못하면, 아무리 데이터 분석을 잘하더라도 편향된 결론에 도달하게 된다. - P172

내가 인지적 편향을 인식한다는 것은 나를 포함한 모든 인간들이 이러한 인지적 편향을 하고 있다는 것을 인정한다는 의미이다. 그리고 이러한 인지적 편향의 인식하는 것이 객관적인 데이터 분석을 할 수 있는 기본이 된다. - P172

데이터 리터러시를 갖고 있다는 것은 어떤 의사결정이 필요한 문제를 과학적으로 접근해 모델링을 하고, 감정이나 감성이 아닌 합리적인 판단을 하도록 돕는 능력을 의미한다. - P173

행동경제학은 인간들이 이성적이고 합리적인 판단을 한다는 전제를 부수고 들여다보는 학문이기에, 개인이나 집단에서 표출되는 인간 습성의 데이터를 다루는 사회과학분야에서는 꼭 필요한 학문적 도구이다. 이러한 인지적 편향을 깨는 것들(행동경제학, 게임이론 등)을 잘 이용해야 데이터 리터러시를 갖게 된다. - P173

페이오프 함수Payoff Function(각 플레이어가 전략적 선택에 따라 받게 되는 보상이나 결과를 수학적으로 표현한 것) - P177

가장 흔하게 사용되는 게임이론 중 하나인 혼합 전략MixedStrategy은 게임 이론에서 플레이어가 여러 전략 중 하나를 확률적으로 선택하는 방식이다. 이를 통해 전략적 우위를 분석하거나 내쉬 균형을 찾기도 한다. 혼합 전략의 일반적인 적용은 바로 일명 "찍기" Randomize라 불리는 방법이다. - P178

(때로는 찍기가 최선의 전략이다) - P179

우리 큰 딸이 나나 아내 몰래 나쁜 짓을 덜 하는 이유는 아빠인 내가 모든 일을 알고 있어서가 아니라, 내가 어느만큼 알고 있는지 모르기 때문이다. - P179

딸 아이 예제에서의 최선의 전략을 적용하는 방법은 아이가 뭔가 나쁜 짓을 하다가 들켰을 때 무조건 혼내는 것이 아니라 때로는 (1)혼도 내다가, 또 때로는 (2) 모른 척 넘어가기도 하다가, 또 가끔은 (3) 나중에 슬쩍 알려주기도 하는 것이다. 각각의 비중은 상황에 따라 차이가 있지만, 통상적으로는 (2)>(3)>(1)의 순서가 좋다. - P180

즉, 도덕적으로 아주 중요한 문제가 아니면 되도록 혼은 내지 말고 설령 눈치를 채더라도 대부분은 그냥 넘어가 준 다음, 가끔 딸에게 "너 예전에 그런 거 아빠가 알고 있었다" 정도만 말하는 것이다. 이러한 순서가 중요한 이유는 혼을 내는 것은 가장 직접적으로 영향을 줄 수는 있지만, 그 효과가 오래가지 않기 때문이다. 잘못했다고 매를 들면, 처음에는 바로 효과가 나타나는 것같지만, 결국 (아이들 입장에서) 내성이 생겨서 더 강한 자극을 요구 받는 것과 같은 이치이다. - P180

게임 이론은 데이터 분석이 필요하다고 생각되는 문제를 다른 각도에서 바라보고 이에 대한 해결책을 제시할 수 있는 좋은 대체재 - P181

다양한 문제 상황에 대해 과학적, 논리적으로 표현(모델링) 하는 훈련에 있어 수학만큼 좋은 도구가 없다 - P182

어떤 문제에 대한 최적화된 문제 꼴을 찾고, 해당 문제 꼴을 쉽게 풀 수 있는 기법을 선정하는 것이 바로 시스템 및 프로세스 설계이다. 즉, 데이터 분석을 하기에 앞서 이 같은 프로세스 설계가 문제의 현상과 본질을 이해하고 적용하는 것이 더 중요하다. 데이터 분석보다 훨씬 더 말이다. - P182

데이터 사이언스에서 시스템이나 오퍼레이션이 중요한 이유는 데이터 사이언스를 이용한 분석 도구가 하나의 시스템으로 설계한다고 했을 때, 일련의 절차를 필요로 하기 때문이다. 그리고 분석을 잘하기 위해서는 제대로 된 시스템과 절차 설계가 데이터 분석 도구 자체의 성능보다 훨씬 중요하게 작동한다. - P188

"Everybody‘s responsibility is no one‘s responsibility."
모두의 책임은 어느 누구의 책임도 아닌 것이 된다. - P195

데이터와 관련한 분야를 아우르는 기초 학문은 통계학이며, 컴퓨터 이론과 관련된 분야를 아우르는 기초 학문은 수학이다. 이렇게 다른 듯 같은 분야를 두루두루 이해하기 위해서는 기초가 되는 학문 영역을 잘 알아야 한다. 이러한 기본이 되는 영역을 제대로 안다는 의미는 단순히 데이터 사이언스 자체를 공부한다는 것을 넘어서 문제의 본질을 다양한 각도로 파악할 줄 아는 것과도 깊은 연관이 있다. - P197

문제의 본질을 정확히 이해하고 파악하는 데 필요한 것이 리버럴 아트Liberal Arts (인문학)이다. 인문학 공부를 아주 간단하게 요약하면 미래에 발생할 문제를 해결하는 데 있어서 필요한 바탕과 기본을 공부하는 학문이라고 할 수 있다. 즉, 무엇이 문제이고 그 문제가 왜 일어났는지를 정확히 파악할 수 있어야 문제 정의를 할 수 있고 필요에 따라서는 데이터 사이언스를 이용해 문제 해결을 할 수 있다. 문제가 제대로 정의되지 못하면 아무리 뛰어난 분석을 한다고 해도 다 헛일이다. - P198

조기 교육 단계에서는 세상을 살아가는 데 있어서 발생하는 수많은 크고 작은 문제들을 스스로 해결하는 기본을 배우는 공부에 집중하는 게 맞다. 그래야 새로운 문제를 당면했을때, 그 문제의 본질을 제대로 읽을 수 있다. - P198

우리가 데이터 리터러시라고 말하는 것도 결국 또 다른 문제 꼴인 데이터를 제대로 이해하는 것이다. 그리고 이러한 제대로 된 문제의 이해는 데이터와 관련된 모든 문제를 푸는 시발점이 된다. 이는 비단 데이터에만 해당하는 것도 아니다. 문제를 표현하는 모든 수단(문장/글, 수학 수식, 데이터 세트, AI 모델 등)에 다 해당한다. - P198

결국은 문제의 본질을 읽는다(혹은 이해한다), 라는 기본 의미에서 벗어나지 않는다. - P199

리터러시는 정보를 읽고 이해하는 능력이다. 그 정보가 어떤 경로(책인지, 모니터인지, 킨들인지, 휴대폰인지 나아가 빅데이터인지, AI인지, 챗GPT인지)를 통해서 만들어지는지는 중요한 요소가 아니다. - P199

리터러시를 향상하기 위해서는 주어진 문제의 문맥(상황)이나 인과관계를 논리적으로 추론할 수 있는 기본적인 소양을 갖추는 것이 중요하다. 이때 필요한 것이 수학적 사고력을 포함한 리버럴 아트, 인문학이다. - P199

챗GPT는 GPTGenerative Pre-trained Transformer를 기반으로 한 챗봇chat Bot이다. GPT는 (인공지능) 언어 모델 중 하나로 빅데이터를 사용하는 거대 언어 모델LLM: Large Language Model 계열에 속해 있다. 여기서 "거대"라는 단어가 의미하는 바가 바로 빅데이터이다. 그러니까 빅데이터라고 불리는 거대한 언어데이터가 없었다면, GPT는 탄생할 수 없었다. - P204

GPT가 가지는 또 하나의 특징은 바로 생성형 인공지능Generative Artificial Intelligence 인데, 어떤 결과를 도출하는 데 있어서 기존의 인공지능 모델들은 학습에 사용된 데이터를 기반으로 그 결과를 도출하는 것에 반해 생성형 인공지능은 기존의 학습을 기반으로 결론이나 데이터를 새롭게 만들어 내는 모델이라는 점에서 차이점을 갖고 있다. - P204

리즈닝 Reasoning이란 주어진 조건(혹은 데이터)을 가지고서 여러 각도로 추리해서 결과를 생성해 내는 것으로, 인간만이 할 수 있다고 생각한 영역을 이제는 인공지능이 해낼 수 있게 된 것이다. - P206

이제 점점 더 데이터 분석만 할 줄 아는 데이터 과학자들이설 자리가 없어짐은 지극히 당연하다 하겠다. 데이터 사이언스를 이용하고자 하는 영역의 지식 없이 기본적인 데이터 사이언스 도구만 사용할 줄 아는 수준의 데이터 분석가들은 더이상 살아남을 수 없다. - P206

일반인들 입장에서 중요한 것은 인공지능을 습관처럼 사용하는 버릇을 들이는 것이 중요하다(배운다는 것과는 약간 차별점을 두고서). - P207

챗GPT를 사용하는 습관을 만들기 위해서는 "(GPT를 이용해) 무엇을 할 것인가?"에 대한 고민이 우선 되어야 한다. 이 고민은 챗GPT와 직접적인 관련은 없다. 챗GPT가 되었건, 달리 DALL-E(이미지 생성 인공지능)가 되었건, 에덱셀SDXL(이미지 생성 인공지능)이 되었건 관련 도구들은 "무엇을 할 것인가?"를 정한 다음에 배워야 한다. - P207

기술은 나날이 발전하고, 당신이 미래에 어떤 필요 때문에 해당 기술을 사용할 시기가 되었을 때는 해당 기술은 이미 당신에게 다가와 있을 것이다. - P207

당신이 최신형 컴퓨터를 사려고 한다고 가정해보자. 언제사는 것이 좋을까? 컴퓨터가 필요한 바로 그 순간이다. 하지만 아무리 최신 컴퓨터라도 2~3년이 지나면 구닥다리가 된다. 그러니 필요하지도 않는데 지금 당장 컴퓨터를 구매하는 건 어리석은 짓이다. 기술이란 그런 것이다. 특히, 발전 속도가 빠른 기술은 더더욱 그렇다. 지금 내가 쓰고 있는 기술이 아무리 최신이어도, 1~2년이 지나면 구닥다리가 된다. 그리고 그 기술이 정말 혁신적인 기술이라면, 시간이 지날수록 점점 더 사용하기 편리해지고, 머지 않은 미래에 누구나 사용할 수 있도록 개선된다. 그리고 그때가 되면 지금의 잡지식들은 깡그리 쓸모없는 구닥다리가 된다. - P208

지금 모두가 챗GPT를 쓰고, 달리를 쓰고 있다고 해서 너무안달복달하지 마시라. "The technology shall come to you if you don‘t come to the technology." 당신이 기술에게 다가가지 않는다면, 기술이 당신에게 다가올 것이다. - P208

챗GPT는 자신이 뭔가를 알아서 대답하는 것은 아니다. 챗GPT의 기본이 되는 NLP Natural Language Process (자연어 처리)는 기존 정보를 주는 것이 아니라 기존에 학습한 내용을 기반으로 관련 사항을 "조합"Generative 하는 원리이다. 그래서 많은 양의 학습을 한다고 해서 반드시 좋은 답이 나오는 것은 아니다. 많은 양의 데이터를 학습하면 다양한 조합이 가능한 가짓수가 늘어나고, 결과적으로 그럴싸한 답을 해줄 수 있다는 장점이 있을 뿐이다. - P210

조합 형태의 모사가 중요한 이유는 인간이 생각하는 문학,
예술과 같은 창조 영역이 더 이상 인간의 전유물이 아닐 수도 있다는 이유 때문이다. 이 말인즉슨, 우리가 창조라고 부르는 것도 알고 보면 조합을 통한 모방이었음을 역으로 증명한다. - P210

챗GPT는 앞으로 크리에이티비티 Creativity(창의성/창조성)를 새롭게 정의할 것이다. 우리가 창조적이라 여겼던 많은 것들이(글, 음악, 그림, 디자인, 심지어 혁신 활동까지) 더이상 창조적인 것과 전혀 관련이 없는 "조합"의 영역임을 깨닫게 해준다. - P210

나는 개인적으로 평범한 머리의 집단 지성을 좋아하지 않는다. 그 이유는 평범한 머리가 아무리 모여서 새로운 아이디어를 내봐야 대동소이하다고 생각하기 때문이다. - P211

집단의 구성원이 가진 데이터나 정보를 조합하는 것에서 창조적인 생각이나 아이디어가 전혀 나오지 않는 것은 아니다. 다만 이런 수준의 창조성은 한 명, 혹은 소수의 천재에게서 나온다. 이들의 생각은 세상을 바꾸는 초석이 된다. 이 같은 진정한 의미의 창조성은 챗GPT가 기존의 데이터를 조합해서 만들어 내는 "가짜" 창조성과는 확실하게 구별된다. - P212

앞으로의 예술 작품에 대한 가치는 오로지 대중들에게 얼마나 오랫동안 인기가 있느냐 없느냐로 판단이 될 것이다(가치 = 인기 X 지속 시간). 그러면 예술 작품의 가격은 그 당시의 인기 정도에 따라 매겨질 것이며, 이때 매겨진 가격이 예술 작품의 가치라고 착각하게 된다. - P213

이미 유명한 셀럽의 발로 그린 그림이 몇 십년 미술 전공을 한 예술가의 그림보다 더 비싸게 거래 되는 세상이다. 유명한 유튜버의 1분짜리 음악이 몇십 년 작곡 공부를 한 이들의 곡보다 훨씬 더 인기를 얻을 수도 있다. 결과적으로 예술적 가치는 오로지 대중들의 인기와 그에 상응하는 가격으로 평가 받는 세상이 될 것이다. - P213

인쇄술이 발전하면서 글쓰기의 가치가 사라졌고, 사진기가발명되면서 그림의 (기술적)가치가 사라졌고, 축음기가 나오면서 음악의 가치도 사라졌다. 앞으로는 인공지능이 예술 전반을 향해 그 가치를 사라지게 만들지도 모른다. 오직 인간에 의해 창조되었다는 이유만으로 부여되는 절대적인 예술적 가치따위는 더이상 존재하지 않을 것이다. - P213

챗GPT의 특성 즉, 기존의 데이터(학습)를 기반으로 답을 구하는 것이 아니라 데이터를 기반으로 답을 조합한다는 점은 문학, 사회, 예술과 같이 딱히 정답이 없는 분야에서 더 나은 답을 구하기 위한 집단 지성을 무력화시킨다. 이는 문학, 사회, 예술과 같이 정답이 딱히 없는 분야에서 보다 나은 답을 구하려는 집단 지성은 더 이상 의미가 없음을 뜻하고, 수학이나 과학과 같이 정답(혹은 진리)은 존재하지만 아직까지는 완벽한 정답을 찾아가는 분야에서는 다수(데이터)가 떠드는 대로 해당 연구의 방향성이 쏠릴 가능성이 높아진다는 것을 의미하기도 한다. - P214

혹자는 해당 분야를 알고 있는 전문가 그룹의 데이터를 기반으로 학습하게 될 경우, 대답의 질이 좋아지지 않겠느냐고 하겠지만, 전문가들조차도 정답을 모르는 (그렇지만, 안다고 착각하는) 분야의 문제들에 대해서는 무용지물이다. 오히려 챗GPT와 같은 생성형 인공지능에의 의존은 완전히 정답을 찾기 위한 새로운 방향의 접근을 방해하는 도구로 동작할 가능성이 높다. - P214

챗GPT가 16세기에 나타나 그 당시의 지식을 학습했다고가정해보자. 천동설이 주류였던 그 시대의 챗GPT가 내놓는 답은 지동설이 아닌 천동설일 가능성이 높다. 전문가 집단의 좋은 데이터로 학습했다 하더라도 마찬가지 결과가 나왔을 것이다(16세기에는 전문가들 또한 천동설을 진실로 믿었다). 대중의 집단 지성이 아니라 극소수의 천재(?) 과학자들의 과학적 사고가 없었다면 지동설은 당분간 세상 밖으로 나오지 못했을 것이다. - P215

인공지능의 근간이 되는 데이터 사이언스는 과학이 아니다. 데이터를 기반으로 도출된 해답은 실제에 대한 답(진실)을주는 것이 아니라, 답을 얻기 위해 학습에 사용된 데이터의 대푯값에 따른 결과만 정답으로 제공할 뿐이다. 그리고 이러한 대푯값은 데이터의 다수결에 의해 결정된다. 천동설이 대세인 데이터를 학습한 챗GPT에서는 천동설이 정답이 될 수밖에 없는 것처럼 말이다. - P215

데이터 사이언스는 과학적 기법이라기보다는 다수결(데이터의 대표성)에 의해 정답이 바뀌기에 비과학적 기법으로 보는 것이 타당하다. 특히 찾고자 하는 해답이 사람이나 사회와 관련된 것들(사회 과학 분야)이라면 분석이나 학습을 위한 데이터는 해당 집단의 비과학성(혹은 비합리성)이 개입될 수밖에 없다. 그리고 이러한 데이터의 비합리성은 이후 아무리 정교한 데이터 사이언스 기법이 나온다 하더라도 올바른 해답을 찾기에는 역부족일 수 밖에 없다. - P216

많은 양의 데이터를 기반으로 학습하는 인공지능 기술이ㅈ엄청난 발전을 한다고 하더라도 우리의 미래가 마냥 밝지만은 않은 이유는 누구나 할 수 있는 범용성과 학습 데이터의 태생적 한계로 비롯된 데이터의 비과학성 때문이다. 그래서 우리는 챗GPT와 같은 인공지능을 이용할 땐 하더라도 태생적 한계를 알고 이용해야 한다. 그렇지 않으면 영원히 천동설을 주장하는 사이비 과학자가 된다. - P216


댓글(0) 먼댓글(0) 좋아요(4)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 

이 책에서 말하는 독서의 제3수준에 해당하는 ‘분석하며 읽기‘는 앞의 단계인 ‘기초적 읽기(독서의 제1수준)‘, ‘살펴보기(독서의 제2수준)‘에 이어서 본격적으로 책의 내용을 좀 더 자세히 알기 위한 단계라고 할 수 있다.

지난번 포스팅의 마지막 부분에서 저자는 분석하기의 세부원칙 중 첫번째로 ‘책을 종류와 주제에 따라 분류하라‘ 는 얘기를 했었다. 본문에서는 정확한 분류가 힘든 책의 사례들이 더러 나오기도 했지만, 분류가 힘들 경우 저자는 ‘분석하기‘의 바로 직전 단계인 ‘살펴보기‘를 먼저 할 것을 권한다. 이 작업을 먼저 거치면 자신이 읽으려는 책이 어떤 종류와 주제를 담고 있는 책인지를 분류하는 것이 좀 더 수월해진다고 저자는 말한다.

‘살펴보기‘에 대해 복습 차원에서 다시 한 번 간단히 언급하자면 책의 제목, 챕터별 부제, 목차 그리고 저자의 머리말이나 서론, 마지막 부분에 나오는 찾아보기 등을 미리 훑어보는 것이라고 할 수 있다. 이런 것들은 대다수의 독자들이 간과하고 넘어가는 경우가 많은데, 저자는 이러한 ‘살펴보기‘만 제대로 하더라도 비교적 단시간 내에 굉장히 많은 것들을 얻어갈 수 있다고 독자들에게 끊임없이 강조한다.

여기 별도로 밑줄치진 않았지만, 오늘 읽기 시작한 부분에서는 에드워드 기번이 쓴 《로마제국 쇠망사The Decline and Fall of the Roman》라는 책과 관련된 얘기가 나온다. 저자는 자신이 가르치는 (비교적 읽기 수준이 높다고 평가되는) 학생들에게 이 책의 1장에 왜 ˝안토니누스 왕조 시대 제국의 영토와 군사력˝이라는 것이 나오는지에 대해 물었다고 하는데 그 학생들 중 아무도 저자의 질문에 대답하지 못했다고 한다.

이 질문에 대한 답을 잠깐 설명하자면 비록 본문을 직접 읽기 전일지라도 책의 제목에 ‘쇠망사Decline and Fall‘라는 말이 들어있었고 1장에서 ‘안토니누스 왕조‘에 대해 나왔으므로 저자가 ‘살펴보기‘ 단계에서 언급했던 제목과 목차만이라도 파악했더라면 안토니누스 왕조가 로마제국의 절정기였던 왕조였고 여기서부터 몰락이 시작된다는 식으로 어느정도 전반적인 내용의 유추가 가능했다는 게 저자의 생각이다.

이러한 저자의 생각을 보면서 본문으로 직접 들어가기에 앞서 위와 같은 ‘살펴보기‘를 통해 선제적으로 본문의 내용을 예상하면서 읽어나가는 것이 한 번을 읽더라도 본문 내용을 좀 더 깊이있게 이해하는 데 훨씬 더 도움이 되겠다는 생각을 할 수 있었고 자연스럽게 저자가 ‘살펴보기‘를 반복해서 강조하는 이유를 느낄 수 있었다.

제목을 잘 파악해 두면 책을 읽기 전에 그 책에 대한 기본적인 사실을 미리 알 수 있다. - P76

사람들이 제목과 머리말에 신경 쓰지 않는 또 다른 이유는 읽고 있는 책을 분류하는 것이 중요하다는 생각을 못 해서다. 그래서 분석하며 읽을 때 이 제1원칙을 따르지 않는 셈이다. 하지만 이 원칙을 따라 하면 저자들에게 감사할 것이다. 저자들은 자신이 쓴 책이 중요하다고 생각하기에 머리말이나 제목, 부제에 이를 잘 표현해 놓는다. - P77

아인슈타인과 인펠트는《물리학의 발전》이라는 책 서문에서 "일반 대중도 읽을 만한 과학책이라고 해서 소설처럼 읽어서는 안 된다"라고 했다. 또 자세히 다루기 전에 독자들의 이해를 도우려 내용을 분석한 목차를 만들었고 주제의 의미를 상세히 부연 설명해 주는 표제를 각 장에 적어두었다. - P77

이 책이 어떤 책인가 하는 질문에 답을 하지 못하는 사람은 이러한 것들을 눈여겨보지 않은 그 자신의 책임이다. 그리고 이 질문에 답을 하지 못한다면 다른 질문들에는 더더욱 답을 못하고 쩔쩔맬 수밖에 없다. - P77

그럼 제목만 읽으면 될까? 내용을 가장 분명하게 표현해 놓은, 세상에서 가장 확실한 제목이라도 머릿속에 책을 분류할 표가 미리 그려져 있어야 한다. - P77


댓글(0) 먼댓글(0) 좋아요(7)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 

좋은 기회가 되어 읽어볼 수 있게 되었다. 삶과 죽음이라는 주제는 누구에게나 그렇듯 사뭇 진지하게 다가온다. 이 책을 통해 바쁜 삶 속에서 잊고 지냈던 중요한 것들을 다시금 깨달을 수 있는 시간이 될 수 있길 바래본다.
.
.
.
오늘 포스팅의 후반부에서 기록의 중요성에 대한 얘기가 나온다. 기록하지 않으면 금방 잊혀지고 역사 속에서 흔적도 없이 사라지지만, 기록이 남아있다면 기록했던 것을 보고 기억을 떠올릴 수 있기 때문이다.

근데 여기서 죽음과 관련된 얘기를 하다가 왜 갑자기 기록에 대한 얘기가 나왔냐는 식의 의문을 가질 수 있는데, 이것은 저자가 법의학자로 일하면서 정확한 원인미상의 죽음이 생각외로 굉장히 많다는 것을 알게 되어 만약 망자들이 죽기 전에 관련 기록이 남아있었다면 보다 정확한 사망 원인을 아는데 조금이나마 도움이 될 수 있었겠다는 판단에서 나온 저자의 생각이다.

독자인 나는 이 책에서 다루는 죽음과 관련된 기록뿐만 아니라 우리가 일상생활에서 남기게 되는 기록들 또한 중요하다고 생각한다. 가장 큰 이유는 저자와 마찬가지로 잊지 않기 위함이라고 말할 수 있다.

어쩌면 이런 블로그나 북플 앱을 통해 독서기록을 남기는 것도 내가 독서한 내용들을 잊지 않고 기억하기 위함이 아닐까 싶다. 물론 다른 이유가 있으신 분들도 있겠지만 그건 그분들의 몫이고, 어쨌든 나는 기록하지 않으면 읽었던 책의 내용들을 기억하는 것이 어렵다는 판단하에 이렇게 글을 남긴다. 물론 잘 쓰면 더 좋겠지만, 그것보다는 내가 읽고 알게 되거나 느낀 것들을 자유롭게 기록하는 데 더 중점을 두는 편인 듯하다.
.
.
.
오늘 읽은 부분 중에서 여기 별도로 밑줄치진 않았지만 그리스의 마지막 철학자였던 플루타르코스가 자신의 아내에게 썼던 위로의 글이 나온다. 플루타르코스는 《플루타르코스 영웅전》이라는 작품으로도 유명한 사람인데, 자신이 일 때문에 집을 떠나있던 동안 딸아이가 사망했다는 소식을 뒤늦게 들었다고 한다. 이 상황에서 플루타르코스 자신도 물론 고통스럽고 슬펐겠지만 자신 못지 않게 슬퍼하고 있을 아내의 마음을 위로하고자 편지를 썼다고 한다.

이 편지에서 플루타르코스는 딸아이에 대한 고통스러운 생각으로 인해 자신의 딸아이에 대한 기억마저 지우지는 말자는 말을 아내에게 건넨다. 슬픔에 파묻혀 딸아이가 주었던 기쁨마저도 잊어버리진 말자는 게 이 편지의 핵심이다.

저자는 이 편지에서 영감을 받아 자신이 업무상으로 만나게 되는 유족들에게 자신이 유가족의 슬픔을 이루 헤아릴 수는 없겠지만 아이와 함께 했던 소중한 추억들은 잊지 마셨으면 좋겠다는 말로 위로를 건넨다고 한다.

법의학자의 직업 특성상 유가족들을 자주 만날 수 밖에 없을텐데 저자의 말이 유가족들에게 100% 위로가 되기는 물론 힘들겠지만 죽음이라는 것을 받아들여야 하는 사람들에게 이보다 더 나은 다른 어떤 위로가 있을까 싶기도 하다.

개인적으로 이 부분을 읽으면서 죽음이라는 것이 당연히 슬프고 마음 아픈 일이지만, 어차피 모든 인간은 언젠가는 죽을수밖에 없다는 사실을 덤덤히 받아들이고, 죽음으로 인한 고통의 바다에서만 허우적대기보다는 살아생전에 망자와 함께 했던 좋았던 추억들을 잘 간직하고 그러한 기억들을 더듬어보려는 태도가 이 세상에 남아있는 사람들에게 좀 더 바람직한 태도라는 생각이 들었다.

물론 말은 이렇게 썼지만 만약 내가 당사자가 된다면 이렇게 담담하게 내 마음을 잘 다스릴 수 있을지는 솔직히 잘 모르겠다. 하지만 현실적으로 저자가 인용한 플루타르코스의 얘기처럼 생각하고 마음을 다잡는 것이 왠지 그냥 맞는 것 같다. 이는 어쩌면 고전이 괜히 고전인게 아닐 것이라는 생각 때문인지도 모르겠다.
.
.
.
오늘 포스팅의 맨 마지막에는 영혼에 대한 저자의 의문이 나온다. 솔직히 독자인 나는 평소 이런 생각을 진지하게 해본 적이 거의 없었는데, 이 부분을 읽으면서 저자의 궁금증에 호기심이 생겼다. 영혼에 대한 좀 더 자세한 저자의 생각은 다음 포스팅에서 다뤄보도록 하겠다.

"누군가에게 일어난 일은 누구에게나 일어날 수 있다. 살아 있다는 것을 당연하게 생각하지 마라. 죽음에는 분명한 교훈이 있다."

내가 책의 저자라면, 나는 사람들의 다양한 죽음을 기록하고 또 논평할 것이다. 죽음을 가르치는 사람은 동시에 삶도 가르쳐야 할 것이다. _몽테뉴《수상록》 - P5

"모든 의사들이 사람을 살리려 하지만, 저는 이미 사망한 사람을 통해 놓친 것이 무엇일까를 되짚어보는 것도 중요하다고 생각합니다." - P7

""불광불급不狂不及, 미치지 않으면 미치지 못한다." - P8

"우리가 보는 것들은 모두 다 죽어가는 것들이다." _마르쿠스 아우렐리우스《명상록》 - P9

그렇다. 새순도, 갓 태어난 아기도 계속 늙어가고 죽어가는 과정에 있다. 그 무엇도 더 젊어지는 것은 없다. - P9

죽음은 항상 우리 곁에 있다. 삶의 맨 끝에서 만나는 것이 아니라, 마치 동전의 뒷면처럼 언제든지 순간적으로 그 모습을 드러낼 수 있는 존재다. - P9

‘팩트fact‘라는 단어는 라틴어 ‘파케레facere‘라는 말에서 유래했는데, 이는 ‘만들다, 하다‘ 라는 뜻을 가지고 있다. 사실로 제시되지만 거짓일 수 있는 것에 대해 사용되었다. - P10

"여러분, 눈이 쌓였다고 눈사람을 만드는 것은 아닙니다. 실은 겨울이라는 환경이 있기에 가능한 겁니다. 그러니 눈만 보지 말고 겨울을 볼 줄 아는 사람이 되기 바랍니다." - P11

인간이 하나의 객체로 성장해 어떤 쓸모를 다하기까지, 얼마나 많은 이가 서로 영향을 주고받겠는가. 그래서 우리가 기대고 희망을 얻을 것은 사람뿐인지도 모르겠다. - P12

어떤 죽음인들 갑작스럽지 않을까. - P19

"건강한 눈은 보이는 것은 모두 보아야 하며 ‘나는 초록색만 보고 싶다‘고 말해서는 안 된다. (...) 건강한 청각과 후각은 들을 수 있는 것은 모두 듣고 냄새 맡을 수 있는 것은 모두 냄새 맡을 준비를 하고 있어야 한다. _마르쿠스 아우렐리우스,《명상록》 - P21

인간의 몸은 보고 싶은 것만 보고, 맡고 싶은 것만 맡을 수 없다. 인생도 마찬가지다. - P21

사연 없는 시신은 없다. - P22

멍의 색깔이 다양하다는 것은 손상의 시기가 제각각 다르다는 것으로, 이는 상습적이고 만성적인 구타의 흔적으로 볼 수 있었다. - P23

모르투이 위워스 도켄트 Mortui vivos docent, 죽은 자가 산 자를 가르친다는 말이다. 의학도들에게는 아주 유명한 라틴어 격언이다. 죽은 자가 자신의 몸을 통해 산 자에게 가르침을 준다는 의미다. 이 격언에 등장하는 ‘도켄트docent‘라는 말이 파생되어 ‘닥터doctor‘라는 단어가 생겨났다. 그만큼 의학이 발전하는 데 있어서 죽어간 사람들이 얼마나 큰 공헌을 했는지 알 수 있다. - P23

살아 있는 사람에게만 의사가 필요한 것은 아니다. 오히려 죽은 사람은 이제 자신의 몸을 의사에게 보여줄 기회는 마지막 단 한 번뿐이 남지 않았기에 더욱 절실하다. 삶의 마지막 순간 침상에 누운 그들을 내려다봐줄 의사가 되어주는 것, 법정에서 그들을 대신하여 억울함을 밝혀줄 증언자가 되는 것, 그것이 법의학자의 역할이다. - P24

법의학자는 의사이자 고인의 대변자이며, 철저한 과학적 증거로 사실만을 말하는 사람이다. - P25

살아있는 사람에게만 의사가 필요한 것이 아니라, 죽은 사람에게도 의사가 필요하다는 생각 - P29

젊은이의 직업 선택의 십계

1. 월급이 적은 쪽을 택하라. - P30

2. 내가 원하는 곳이 아니라 나를 필요로 하는 곳을 택하라. - P30

3. 승진의 기회가 거의 없는 곳을 택하라. - P30

4. 모든 것이 갖추어진 곳을 피하고 처음부터 시작해야 하는 황무지를 택하라. - P30

5. 앞을 다투어 모여드는 곳은 절대 가지 마라. 아무도 가지 않는 곳으로 가라. - P30

6. 장래성이 전혀 없다고 생각되는 곳으로 가라. - P30

7. 사회적 존경 같은 건 바라볼 수 없는 곳으로 가라. - P30

8. 한가운데가 아니라 가장자리로 가라. - P30

9. 부모나 아내가, 약혼자가 결사반대를 하는 곳이면 틀림없다. 의심치 말고 가라. - P30

10. 왕관이 아니라 단두대가 기다리고 있는 곳으로 가라. - P30

모든 만남은 기적이다. 서로의 존재도 모른채 각자 다른 우주를 살고 있던 두 사람이 같은 시간에, 같은 장소에서 만나게 되는 것은 혜성의 충돌처럼 기적 같은 일이다. 어쩌면 우리 둘 중 한 사람이 어느 날 길을 걷다 발을 삐끗하기만 했어도, 운명은 나비효과처럼 변화를 일으켜 우리는 만나지 못했을 수도 있다. - P31

지금까지 내게 있었던 일 중에 어느 하나라도 일어나지 않았거나, 혹은 내게 없었던 어떤 새로운 일이 일어났더라면, 나는 법의학자가 되지 않았을지도 모르고 그 사람을 만나지 못했을 수도 있다. 모든 만남은 기적이며, 그래서 나는 곁에 있는 모든 사람이 다 고맙고 감사하다. - P32

물에 빠져 부패한 시신에서는 사인을 규명하기 어렵다. 그것은 의학이 그때보다 훨씬 더 발전한 지금도 여전히 어려운 일이다. - P33

내가 그랬듯 모든 법의학자는 직업 선택의 십계를 따른 사람들이다. 월급이 적은 곳, 승진의 기회가 거의 없고, 오려는 사람이 거의 없는 황무지 같은 곳, 부모나 아내가 결사반대하는 곳으로 기꺼이 걸어온 사람들이다. 자신이 원하는 곳이 아니라 자신을 필요로 하는 곳을 택한 사람들, 왕관이 아니라 단두대가 기다리는 곳을 택한 사람들이다. - P35

생각해보면 우리 사회 격변의 시기에 법의학자가 국가 권력의 편에 섰던 적은 단 한 번도 없었다. 권력과 자본에 양심을 속이려는 사람이었다면 애초에 이 길을 선택하지도 않았을 테니까 말이다. - P36

나는 스스로에게 단 한 점 부끄러운 일을 만들지 않도록 모든 일에 조심 또 조심하게 되었다. 법의학 선배들이 이토록 외롭고 힘들게 지켜온 원칙과 신념을 이어가기 위해. - P36

물결 이는 수면 위에 비죽 튀어 나와 있는 그것은, 사람의 발이다. 추락해 바다에 빠진 이카로스의 발. 사람들은 어제와 같은 하루를 보내고, 마을은 평화로운 저녁을 맞이할 준비를 하고, 그리고 어디선가 누군가는 죽어간다. 지금 이 순간에도 어떤 이는 죽어가겠지만 우리는 아무런 인식도 하지 않는 것처럼 말이다. 차마 안타깝게 죽어가는 어린 소년의 얼굴을 볼 수 없어 발만 그린 것일까.

<이카로스의 추락이 있는 풍경> _16세기 네덜란드 화가 프터르 브뤼헐Pieter Brueghel의 그림을 보고 난 뒤 남긴 저자의 생각 - P39

사람의 죽음이 국가에 공식적으로 기록되는 절차인 ‘사망 등록‘은 사망진단서 발급 일자로부터 한 달 이내에만 관할 주민센터에 접수하면 된다. - P42

시신의 이상 여부를 판단할 수 있는 전문가인 법의학자는 ‘사망-장례-사망 등록‘의 전 과정에서 아무런 의견을 내지 못한다. 죽음에 대한 전문가의 검증은 전혀 이루어지지 않는다. - P42

아주 오랫동안 우리 사회의 관행으로 굳어진 문화여서 우리는 ‘장례(화장 혹은 매장)후 사망 등록‘이라는 절차가 이상하다고 여기지 못하지만, 대다수 외국에서는 우리와 정반대의 절차를 가지고 있다. 예컨대 미국, 영국, 일본 등의 경우에는 사망 등록이 먼저 이루어져야만 장례를 치를 수 있다. 유족이 사망 신고를 하면, 법의학자와 같은 전문가의 검토하에 범죄 혐의가 없다는 것을 인증받은 뒤에야 화장 혹은 매장 허가증을 국가로부터 발급받을 수 있고, 그래야 장례식을 치르고 고인을 묻을 수 있게 된다. 우리나라와는 순서가 정반대다. 어느 쪽이 합리적인 사회일까. - P43

보이지 않고, 기록해두지 않고, 근거를 밝히지 않는 일들은 머지않아 우리 모두의 기억에서 사라진다. 매년 원인을 모른 채 사라지는 2만 8천 명의 사람들이 애초에 우리 사회에 없었던 것처럼 기억에서 휘발되듯이 말이다. - P44

실패한 사례는 잘 드러나지 않는 까닭에 성공한 사례만을 보고 잘못된 편향에 빠지는 것을 가리켜 생존자 편향survivorship bias이라고 한다. - P46

"누군가에게 일어난 일은 누구에게나 일어날 수 있다." _세네카 - P47

무엇이 위험하고 무엇을 고쳐나가야 하는지에 대한 힌트는 사인 없이 죽어간 2만 8천 명 속에 있다. 우리 옆에서 조용히 사라져간 사람들, 죽어간 사람들 속에 우리 사회의 불완전함이 있다. 우리가 무엇을 놓치고 있는가는 거기서부터 찾아야 한다. - P47

보려고 해야 볼 수 있고, 알려고 해야 알 수 있다. 이미 썩어 뼈만 남은 코끼리의 화석에서는 결코 코를 찾을 수 없다. - P47

우리가 어떻게 세상에 존재하게 되었는지를 앎으로써 인생을 이루어나가듯이, 죽음에도 앎의 완성이 필요하다. 누가,
언제, 어디서, 무엇을, 어떻게, 왜 죽게 되었는지 알아야 한다. 망자를 대신하여, 살아남은 우리가 죽음의 육하원칙을완성해야 한다. 그것은 떠나간 사람을 위한 일이기도, 또 그들을 밀어낸 이 세상을 살아갈 우리를 위한 일이기도 하다. - P48

어린아이가 돌연사하는 경우, 사법당국에서는 혹시 모를 아동학대의 가능성을 확인해야만 하기 때문에 부검을 강제집행하게 된다. 아이들을 위해 반드시 거쳐야 하는 과정이긴 하지만, 이로 인한 부모의 정신적 트라우마까지 고려해 설명을 해야 하는 법의학자에게는 괴로운 순간이다. - P50

"제가 감히 상상도 할 수 없는 슬픔이겠지만, 그 아이가 부모님들께 주었던 보석 같은 추억들이 퇴색하지 않을 정도로만 슬퍼하시기 바랍니다." - P52

그리스어 ‘타나토스thanatos‘는 ‘죽음‘을 의미하는데, ‘어두운‘, ‘흐린‘이라는 의미를 나타내는 어근에서 비롯되었다고 한다. - P52

그리스어 ‘프네우마pneuma‘는 ‘숨결‘, ‘숨쉬기‘, ‘영혼‘ (물리적 몸을 차지하고 지배하는 보이지 않는 활기찬 원리 또는 개체라는 라틴어 psyche)을 의미한다. 우리 몸의 숨구멍을 통해 영혼이 들어오고 나가는데 이것이 멈추면 몸을 떠난 영혼이 다른 세상으로 간다는 뜻이다. - P52

영혼은 어디서 와서 어디로 가는 걸까? 우리는 몸을 통해 고통과 통증도 느끼지만 슬픔과 그리움, 아쉬움, 사랑도 느낀다. 무엇이 주인일까, 몸일까 영혼일까? 만약 몸을 떠난 영혼이 나의 진짜 정체성이라면, 굳이 몸을 통해 인생을 살아야 할 이유는 뭘까? 늘 머릿속에서 떠나지 않는 물음이다. - P52


댓글(0) 먼댓글(0) 좋아요(5)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 

다른 책들을 읽다보니 본의아니게 이 책은 정확히 1달만에 다시 집어들게 되었다.

오늘 시작하는 내용은 ‘로마의 탄생‘이라는 소제목의 글인데, ‘로마‘라는 도시의 이름이 나오게 된 배경에 대해 새롭게 알 수 있었던 시간이었다.

개인적으로는 과거 중고등학교 시절에 학교에서 세계사 시험을 보면 그냥 단편적인 지식들을 암기해서 시험지에 모조리 쏟아내고 시험이 끝난 뒤에는 그저 단순암기했던 것들을 잊어버리는 식의 패턴이 반복되어 이 과목에 그다지 큰 흥미를 못 느꼈었는데, 지금 읽고 있는 이 책의 경우 단편적인 지식보다는 어떤 스토리와 흐름 위주로 역사를 접하다보니 좀 더 흥미를 가지고 읽을 수 있어서 좋았다.

또한 너무 자잘한 세부사항보다는 ‘익스프레스‘라는 책의 제목답게 굵직굵직한 사건들 위주로 간단히 짚고 넘어가다보니 왠지 속도감있게 세계사를 훑어나가는 느낌도 받았다. 그래서 이 책이 역사에 대한 흥미를 다시금 북돋아 주는 좋은 도구라는 생각이 들었다. 이 자리를 빌어 저자께 감사드린다.




기원전 753년, 오늘날 이탈리아 지역에서 로마가 탄생했습니다. 전설에 따르면, 로물루스가 쌍둥이 동생 레무스를 죽이고 자신의 이름을 따 도시를 세웠다고 전해집니다. - P34

로마 건국 신화에 따르면, 로물루스와 레무스는 부모에게서 버려진 뒤 늑대의 젖을 먹으며 자랐습니다. 두 형제가 세운 로마는 테베레강이라는 전략적 요충지에 위치해 유리한 교통 조건을 갖추고 있었습니다. 그러나 형제간의 갈등은 비극적으로 끝났죠. 로물루스가 레무스를 죽이는 사건은 로마의 건국이 피와 희생으로 이루어졌음을 상징적으로 보여줍니다. - P34

오늘날 서양에서 사용되는 언어, 달력, 법, 철학, 건축물 등이 모두 로마의 유산입니다. - P162

로마에서 가장 높은 카피톨리누스 언덕 - P169

실속 없는 승리를 가리켜 ‘피로스의 승리‘ - P170

기원전 264년 양국(로마와 카르타고)은 시칠리아섬의 지배권을 놓고 전면전을 벌였는데, 이것이 바로 ‘제1차 포에니 전쟁‘이었습니다. - P170

카르타고에는 한니발이라는 명장이 있었습니다. 참고로 한니발의 이름은 ‘바알Baal의 영광‘이라는 뜻입니다. 고대 페니키아의 신이었던 바알은《성경》과 <디아블로>라는 게임에서 악마로 묘사되기도 합니다. - P171

양군(로마군과 카르타고군)은 칸나에 평야에서 만나 정면승부를 벌이게 되었습니다. 칸나에 전투에서 한니발의 포위 섬멸 작전이 완벽하게 먹히면서 카르타고가 대승을 하게 되었죠. 칸나에 전투에서는 8만 명의 로마군 중에서 무려 7만 명이 전사했습니다. 이는 로마 성인 인구의 20퍼센트에 달하는 어마어마한 숫자였죠. 궁지에 몰린 로마는 더 이상의 전투를 포기하고 시간을 끄는 지연작전을 펼쳤습니다. 한니발은 그 후 10년간 이탈리아 반도를 누비면서 로마를 전장으로 끌어들이려고 했지만, 별 소득이 없었습니다. - P172

어느 정도 국력을 회복한 로마는 스키피오 장군을 보내 역으로 카르타고 본토를 공격했습니다. 카르타고 본토가 공격당하자 한니발은 어쩔 수 없이 이탈리아반도에서 본국으로 귀국해야했죠. 기원전 202년, 자마 전투에서 스키피오가 이끄는 로마군이 한니발이 이끄는 카르타고군을 격파했습니다. 이로써 제2차 포에니 전쟁도 로마의 승리로 막을 내렸습니다. - P172


댓글(0) 먼댓글(0) 좋아요(8)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 

그동안 다른 책들을 읽느라 한동안 우선순위에서 밀려있었는데 간만에 다시 집어들었다.

지난번 포스팅의 마지막 부분에서 데이터 과학이라는 것이 데이터를 다룬다는 본질적인 특성상 그것을 다루는 기법이 어떻게 바뀌든 관계없이 근본적으로는 통계학의 특성을 벗어날 수 없다는 점을 언급했었다.

오늘은 데이터 분석을 위해 사용하는 프로그램 중 대표적인 SPSS, SAP, R 등을 간단히 소개함과 동시에 여기서 분석한 데이터들 역시도 통계학의 영역 안에 있을 수밖에 없음을 강조하면서 시작한다.
.
.
.
바로 뒤이어지는 글에서는 대다수 통계학자 또는 데이터 과학자들이 갖고 있는 데이터와 관련된 믿음 중 하나인 ‘통계적 분석과 기법으로 미래를 예측할 수 있다‘는 것에 대한 저자의 반박이 나온다. 저자가 반박하는 핵심적인 이유는 바로 데이터라는 것은 그 속성 자체가 그저 ˝과거˝ 에 대한 산물일 뿐이기 때문이다. 속성 자체가 이미 미래와는 아무 상관이 없는 ˝과거˝의 것이기에 데이터가 빅데이터든 스몰데이터인지는 애초에 중요한 것이 아니라는 것이다.

개인적으로는 저자의 반박 논리에 어느정도 공감이 가면서도 다른 한편으로는 저자의 얘기에 온전히 동의하기가 좀 망설여졌다. 어쩌면 이것은 독자인 내가 과거에 개인적으로 읽었던 몇 권의 책들에서 봤던 생각들과는 다소 배치되는 것이었기 때문이다.

내가 예전에 읽었던 책들의 핵심 생각을 한 문장으로 표현하자면 ‘과거와 현재와 미래는 하나로 이어져 있다‘ 정도로 정리해볼 수 있는데, 이러한 생각에 따른다면 물론 미래에 일어날 일들을 100% 정확하게 예측할 수는 없겠지만 그래도 확률적으로는 상당히 높은 확률로 미래를 어느 정도 예측할 수 있다고 생각한다. 과거에 일어났던 일들이 현재와 미래에 영향을 미치기 때문이다.

하지만 본문에서 저자는 일말의 여지도 주지 않는 듯한 논조로 통계학자들의 믿음을 철저히 깨부수고 있다. 이 책의 앞부분에서 통계학도 결국 수학이라는 것의 부분집합(즉, 일부)일 뿐이라는 얘기를 했었는데, 이러한 생각에 기반해서 저자가 수학적인 논리에 맞지 않다면 그 하위집합인 통계학도 한계가 있을 수밖에 없다는 생각을 여기서 증명하고자 한 건 아닌가 하는 생각도 해볼 수 있었다. (물론 이것은 지극히 개인적이고 주관적인 생각이기에 독자인 나의 오해가 있었을 수도 있음을 밝히는 바이다.)

하지만 혹시라도 수학이나 논리의 영역으로 설명되기 힘든 어떤 철학적인 것이 있을 수도 있는 것이기에 오늘 본문에 나온 저자의 생각에 온전히 동의하는 것을 개인적으로는 잠시 유보하고 싶다. 물론 향후에 개인적으로 어떤 깨달음을 얻게 되어 저자의 생각에 온전히 동의하게 될 때가 올 수도 있겠지만 지금 당장은 좀 힘들 것 같다.
.
.
.
뒤이어 나오는 글 중에서 개인적으로 인상적이었던 것은 확률과 도박의 차이점에 대한 저자의 생각이었다. 간단히 핵심만 언급하자면, 도박은 그 목적이 미래를 ‘예측‘ 하여 돈을 버는 것에 있지만, 확률은 미래를 ‘관리‘하는 것에 그 목적이 있다는 것이다.

도박은 단순히 돈을 따느냐 못따느냐만이 중요한 것이기에 오로지 ‘맞는 예측‘만이 의미가 있지만, 확률은 설령 그 확률이 굉장히 높을지라도 그 확률값대로 미래의 일이 무조건 발생한다고는 볼 수 없기에 확률에서 발생할 수 있을 것으로 예상하는 두 상황 모두를 대비하기 위한 준비(즉 관리)를 하는데 도움이 될 수 있다. 저자는 이 같은 확률의 속성을 짧지만 강력한 한 문장으로 정리한다.

‘확률의 본질은 관리Management이다.‘
.
.
.
오늘 포스팅의 마지막 부분에서 저자는 감성적인 사고가 아닌 수학적인 사고로 위험에 대한 판단을 해야한다는 말을 한다. 이것은 단순히 말로만 어떤 위험 상황을 느끼는 것과 수학적으로 어떤 위험 상황의 기대값을 계산했을 때의 차이를 비교하면서 의사결정을 해야 한다는 말이다. 설령 감성적으로는 A라는 상황이 더 위험해 보일 수도 있지만 실제로 수학적 개념인 위험의 기대값을 계산해보면 A보다 덜 위험하다고 생각했던 B라는 상황이 실제로는 더 위험할 수도 있다. 근데 여기서 언급한 수학적 개념이라고 하는 것이 중학교 수준에서 배우는 기대값에 근거한 의사결정이기에 무슨 미적분 같은 복잡한 수준이 아니더라도 누구든지 이러한 수학적인 사고에 근거해서 합리적인 의사결정을 내릴 수 있는 것이다.

물론 저자도 수학적인 논리에 근거해 이런 주장을 펼치고는 있지만 실제 현실에서는 학창시절에 공부 좀 했다는 사람들조차도 감성적인 사고에 따라 위험을 인지하고 판단한다는 얘기도 본문에 나오는데, 저자는 이러한 현실에 대해 안타까워 한다.

독자인 나는 이러한 감성과 이성 간의 어떤 대결 구도(?) 같은 걸 보면서 이성이라는 것이 뭔가 논리적으로는 우위에 있어보일 수도 있지만 세상이라는 것이 결코 이성만으로는 돌아가지 않는다는 것을 다시금 느낄 수 있었다. 이와 관련하여 개인적으로 예전에 읽었던 책에서 느꼈던 한 문장의 메시지가 문득 생각났다. ‘본능이 이성을 이긴다‘

사람들이 모두 다 똑똑해보여도 항상 이성적인 사고를 하는 것이 아니다. 만약 모든 사람이 이성적인 사고만 했다면 인간 사회는 마치 로봇과도 같이 딱딱하기만 하지 않았을까 싶다. 인간에게는 감성이 있기에 때로 이성적인 사고의 틀에서 벗어난 어떤 행동을 하기도 하는 것이 아닐까 싶다.

잠시 본론에서 벗어난 느낌인데, 다시 본론으로 돌아와서 이 책이 데이터 관련 책이다보니 아무래도 감성적인 사고의 중요성보다는 이성적인 사고의 중요성을 독자들에게 더 강조하기 위해 수학적인 사고의 중요성 같은 것이 나왔다는 생각을 해보게 된다.

그리고 데이터를 활용하여 의사결정을 하는 것 자체가 아무래도 이성적인 의사결정을 좀 더 잘 하기 위한 것에 그 목적이 있는 것이 때문에 다른 곳에선 어떨지 몰라도 일단 여기서는 저자의 생각을 믿고 따라가는 게 맞다고 본다.

현재 최신 데이터 분석에서 이용하는 SPSS(통계 분석 및 데이터 마이닝을 위해 사용되는 소프트웨어), SAP(시스템 응용 및 제품을 위한 재무, 운영, 자산, 인적 자원 등의 관리와 관련된 기업용 통계 소프트웨어), R(오픈소스 프로그래밍 언어로, 데이터 분석 및 시각화와 관련된 통계 계산 및 그래픽 처리에 사용 됨)과 같은 최신의 소프트웨어 패키지를 사용해 분석을 한다고 해도 통계학의 영역을 벗어날 수는 없다. - P109

수집된 데이터는 "과거"의 데이터이다. 그럼에도 불구하고 많은 통계학자들과 데이터 과학자들은 과거 데이터를 통해 미래를 예측할 수 있다고 믿는다(수학자가 보기에는 이는 틀린 사실이다). 빅데이터라는 용어가 다소 마케팅적인 요소가 강한 단어임에도 데이터 과학자나 통계학자들로부터 지지를 받고 있는 데에는 이 같은 믿음(통계적 기법이 미래를 예측할 수 있다)이 작용하기 때문이다. - P110

통계학자(혹은 데이터 과학자)들은 기존의 기법들로 미래 예측이 정확하지 못한 이유를 충분하지 못한 데이터 때문이라고 생각했다. 그래서 데이터가 충분해진다면(즉, 빅데이터를 이용한다면) 정확한 미래 예측이 가능할 것으로 생각했다. 하지만 ...(중략)... 데이터는 "과거"에 대한 산물일 뿐, 데이터가 아무리 많다 하더라도 미래를 직접 대변해 줄 수는 없다. - P111

분석이 가능하다고 믿는 이유는 한 가지 큰 가정 Assumption을 전제로 하는데, 그 가정은 바로 "과거의 사건이 현재나 미래에도 재현Recursive된다"라는 생각 때문이다. 통계학의 모든 예측 모델은 이 "재현성"을 기반으로 한다. 즉, 과거의 사건이 미래에도 재현된다는 가정하에서 예측이 의미가 있어진다는 뜻이다. - P111

하지만 안타깝게도 통계학자들의 이러한 믿음은 틀린 사실이다. 근본적으로 미래는 재현이 되지 않으며, 어제가 오늘과 다르고 오늘은 내일과 다르다. 단지 비슷하게 보일 뿐이지 절대로 같지 않다. 아무리 데이터양이 많아지고 IT 기술이 발전하여 분석 기술이 혁신적으로 바뀐다 하더라도 미래는 동일하게 재현되지 않는다. 따라서 통계(혹은 데이터 과학, 혹은 빅데이터)를 통한 미래 예측은 시뮬레이션처럼 미래를 모사 Imitate만 할 수 있을 뿐이지 정확히 예측한다는 것은 불가능하다. - P111

이용자들이 구매할 물품을 미리 제안하거나, 사용자가 어떤 단어를 검색했을 때 그다음 검색할 단어를 미리 제안하거나, 콜센터에서 고객이 할 것 같은 추가 질문을 미리 예상하는 것은 예측이라기보다는 ‘패턴‘Pattern에 가깝다. 여기서 "가깝다"고 표현한 이유는 미래에 대한 측정 값이 단순 예측이건 패턴이건 간에 과거에 기인한 것으로 완벽하게 미래를 알려주는 패턴이라고 하기에는 한계가 있기 때문이다. - P113

예측과 패턴은 둘 다 앞으로 일어날 일에 대한 결과 추측이라는 점에서는 닮았다. 그래서 사람들은 예측과 패턴을 같은 의미로 사용하기도 한다. - P113

하지만 예측과 패턴은 엄연히 다르다. 이 둘을 구분하는 기준은 바로 ‘시간의 영향력‘ (혹은 재현성)이다. 시간의 영향력이 크면(즉, 시간에 따라 결과가 달라지거나 바뀌게 된다면) 예측의 문제가 되고, 시간의 영향력이 없거나 작으면 패턴의 문제가 된다. - P113

시간의 영향력이 크다는 의미는 시간에 따라 그때그때 데이터가 변한다는 것을 말한다. 예를 들자면 주식이라든지, 환율이라든지, 원유가처럼 시시때때로 변하는 것을 말한다. 이러한 시간 영향력이 큰 데이터에 대해서 어떠한 주기성을 찾고자 하는 연구 또한 존재하는데, 이렇게 주기성이 찾아진다면, 이 또한 패턴의 문제로 볼 수 있다. - P113

패턴도 데이터와 마찬가지로 ‘과거의 산물‘이다. 시간의 영향력이 적다는 의미는 바로 시간과는 관계없이 특정 조건(흑은 상황)만 되면 결과 값(혹은 추측값)이 같다는 것을 의미한다. 바꿔 이야기하면 재현성이 높아진다는 의미이다. 즉, 시간과 관계없이 조건만 맞으면 동일한 결과가 재현된다는 의미이다. - P113

예측을 목적으로 하는 데이터 분석의 경우 정작 목표로 잡아야 할 것은 미래의 예측이 아니라 과거 데이터에서 ‘패턴‘을 찾는 것이다. 이처럼 예측이 패턴 찾기가 되면 시간에 따라 예측을 하는 것이 아니라, 특정 조건이 맞으면 예상되는 결과를 도출해 내는 단계가 된다. 이러한 패턴 기반의 데이터 분석은 엄밀하게 보면 예측은 아니지만, 그와 비슷한 효과를 낼 수 있다. - P114

데이터 과학(혹은 분석)에 있어서, "예측"은 자주 등장하는주제 가운데 하나이며, 많은 사람들이 관심을 갖는 분야이다. 하지만 (중략) 데이터를 기반으로 한 엄밀한 의미의 (미래)예측은 사실상 불가능하다. 이러한 한계에도 불구하고, 데이터를 기반으로 추측된 값이 갖는 의미와 속성을 정확히 안다면 틀림없이 여러모로 유용한 도구가 될 수 있다. - P114

어떠한 문제점이나 현상에 대한 패턴을 찾는다는 점에서 예측은 데이터 분석에서 여전히 의미가 있다. 다만 문제 자체에 대한 본질과 함께 데이터 분석이 가지는 태생적인 속성도 함께 고려해야 한다. - P114

연료 탱크의 O-링(엔진이나 배수관 연결시 유체나 기체의 누출을 막는 데 사용하는 부품으로 고무패킹 정도를 생각하면 됨) - P116

물체는 온도가 내려가면 수축한다는 기초 물리학의 기본 원리 - P117

데이터 사이언스에서 정작 중요한 것은 데이터를 잘 수집하고 잘 분석하는 것이 아니라, 문제의 본질에 접근해서 적은 노력으로 측정하고 분석하는 방법을 찾는 것이라 할 수 있다. - P118

(일반적인 보폭은 본인 키의 37~45% 정도이다) - P120

데이터 분석에 핵심이 되는 파라미터(변수)를 찾기 위해 별도의 실험을 진행하는 방식을 흔히 파일럿Pilot 혹은 프로토타이핑 Prototyping이라고 한다. 비지니스 애널리틱에서 고객의 선호를 확인하기 위해 사용하는 A/B 테스트가 여기에 해당한다. 즉, 모든 파라미터의 통제가 가능한 환경에서 데이터의 측정을 진행하여, 최적화된(혹은 최적화에 가까운) 파라미터를 설정하고, 이렇게 설정된 파라미터를 기준으로 데이터 분석을 진행하는 것이다. - P122

데이터의 품질이 보증되지 않은 빅데이터는 데이터 분석이 요구되는 문제를 해결하는데 오히려 방해가 된다. 만약, 이러한 문제 해결을 위해서 데이터가 필요하긴 한데 측정하기 어려운 상황이라면 대체 데이터를 생각해볼 수도 있고, 이때 대체 데이터를 고민하다 오히려 문제 해결에 보다 적합한 데이터를 찾을 수도 있다. - P123

반드시 데이터 측정이 필요한 경우라면, 측정되는 데이터는 이왕이면 측정하기 쉬운 것이 좋다. 측정하기가 쉬워야 데이터 분석 모델(혹은 시스템)을 설계할 때도 간편해진다. 많은 양의 데이터(즉, 빅데이터)를 이용해 분석하고자 하는 것은 다른 선택지가 없을 때, 최후에 고려해야 하는 방법이다. - P124

수학은 수학적 증명을 통해 그 답의 진실성 Truth을 담보 받지만, 데이터 사이언스는 아무리 측정된(혹은 수집된) 데이터가 정확하고 충분하더라도 데이터 분석을 통해서 얻은 답이 진실한지(그 답이 참true인지) 여부를 확실히 알 수 없다. - P125

수집할 수 있는 데이터는 결국 한계를 가지고, 이러한 한계를 가진 데이터로 분석된 데이터 값은 수집된 데이터를 대표할 뿐이지, 모집단 전체를 대표하지는 않는다 ..(중략)..
수집된 데이터를 분석한 사실이 전체 데이터(수집되지 못한 데이터를 포함한)의 사실인지를 알 수 없다는 뜻이다. - P126

데이터 사이언스는 수집이 가능한 한정된 데이터에서 분석된 사실이 전체 데이터로 분석된 사실과 동일하다는 가정에서 출발한다. 하지만 이러한 가정은 항상 참이 아니다. - P126

실제로 "완벽한" 동전 던지기의 확률이 진실로 0.5인 이유는 실험 데이터 분석이나 통계로 구해진 것이 아니라, 기하학(벡터)과 물리학(만유 인력법칙)을 기반으로 한 수학적 증명(넓게는 과학적 증명)에 기인한다. 그리고 이러한 증명의 출발은 공정성이 0.5인 완벽한 동전을 "질량이 없는 그리고 높이가 0에 근접하고 넓이가 무한에 근접하는 원판으로 정의 Define 하는 데서 시작한다. 이렇게 정의된 완벽한 동전은 중력의 법칙이 작용한다는 전제하에 바닥에 닿을 수 있는 면이 앞면 혹은 뒷면 단 두 개의 면뿐이 되고, 완벽한 동전을 던졌을 때 앞면이 나올 가능성은 정확하게 0.5가 된다(이는 수학적으로 증명할수 있다). - P129

하지만 현실에서는 "완벽에 가까운" 동전을 찾을 수는 있지만 완벽한 동전이란 존재할 수가 없다. 그래서 위와 같은 과학적 증명이 없는 상태에서의 데이터 분석을 통한 동전의 앞면이 나올 확률값(데이터의 대표값)과 (과학적 증명을 통한)실제 완벽한 동전에서 나올 확률값(진실 값)이 동일 하다고 할 수 있는 근거는 어디에도 없다. - P130

데이터 분석이 보장하는 것은 답의 진실성이 아니라 데이터의 대표성이라는 사실을 잊어서는 안 된다. - P130

데이터 분석을 통해 얻어진 사실의 대표성이 실제 정답인지에 대한 판단은 데이터 분석이 아닌, 다른 방법을 이용해 증명해야 한다. - P130

데이터 사이언스를 사회 과학 분야(경제학, 심리학, 경영학, 정치학 등)에 적용할 경우 실제 정답이 아니라 앞서 동전 던지기의 예제처럼, 데이터 수집 대상의 쏠림 현상으로 데이터의 대표성이 결정되는 경우가 심심치 않게 발생한다. 특히 사회 과학 분야의 경우, 그때의 상황이나 분위기에 따라 분석에 사용되는 데이터들이 선택적 혹은 편향적으로 수집 될 수 있다. 이렇게 되면 틀린 분석을 하게 되고, 틀린 의사결정을 하게 된다. 이 근본적인 한계는 반드시 알고 있어야 한다. - P131

데이터 기반의 의사 결정의 가장 큰 맹점은 데이터 이외의 것을 보지 않는 데 있다. 데이터 사이언스를 한답시고 이 한계를 모르고 있어서는 안 된다. - P131

과학적으로 설명되지 않는 많은 현상들을 분석하기 위해서 수치화해서 모으고, 이를 바탕으로 분석하여 인사이트를 찾아가는 데이터 사이언스는 특히 정형화(혹은 모델링)가 힘든 과학 분야(열역학, 유체역학 등)나 체계화 자체가 불가능한 사회과학 분야에서는 여전히 유용한 분석방법론이자 도구이다. 하지만 아무리 유용한 도구라도 그 한계를 정확히 인지하고 사용해야 도움이 된다. 설령, 데이터를 통해 분석된 대표 값이 실제 정답과 거리가 있다 하더라도 말이다. - P131

Sometimes, something is better than nothing (때로는 아무 것도 없는 것보다 무언가 있는 게 낫다). - P131

확률을 이해하는데 있어서 또 한 가지 중요한 포인트는 동시성이 존재한다는 점이다. 즉, 70%로 이길 확률이라는 것은 30%의 질 확률(이기지 않을 확률)을 동시에 의미하기도 한다. 이를 수학적으로 표현하면 "존재({이길 확률}) = 존재 ({질 확률})"을 의미한다. 그러나 이미 경기가 끝나, 승부가 결정된 상태에서는 확률이라는 숫자는 중요하지 않기 때문에 {"이길 확률(미래)}" =/=  "{이긴 상태(과거)"}가 된다. 즉, 이길 확률이 있다고 실제로 이긴 것(사건)은 아니라는 뜻이다. - P134

도박과 확률은 아무런 관련이 없다. 내일 경기에서 지든 이기든 그것과 데이터 분석으로 나온 대표값(확률)과는 직접적인 관계가 없다. 아무리 이길 확률이 높게 나오더라도, 내일(혹은 미래) 게임에 질 수 있다. 데이터 분석을 통해 이길 확률 90% 이상이 나온다 하더라도, 정작 도박(?)을 하는 나의 입장에서는 도박에서 이기거나 질 확률은 50%이다(이기거나 지거나). - P135

결과를 놓고서 자신의 분석 방법 자체의 타당성을 판단할 수는 없다. - P135

통계적 분석이나 데이터의 타당성이나 유효성 여부와 실제 결과와 예측의 일치성 여부는 아무런 관련이 없다. - P136

확률은 어떤 의사결정을 하는 데 필요한 지표를 수학적으로 계산한 것이지, 확률(값)이 미래의 특정 결과를 미리 보여주는 것은 아니다. 다음 판에 이길 확률 90%라고 해서 반드시 이기는 것이 아닌 것처럼, 확률 자체가 어떤 미래를 결정짓는 표식은 될 수 없다. - P138

확률이 도박과 가장 다른 점은 목적이 "예측"에 있는 것이 아니라 "관리"에 있다는 것이다. 이는 게임에서 단순히 이기거나 지거나, 승부 예측을 통해서 돈을 버느냐 마느냐 같은 것이 아니라, 확률에 따라 자원을 어떻게 효율적으로 운영하느냐에 중점을 둬야 한다는 것을 말한다. - P138

확률의 목적성은 확률을 기반으로 하는 통계, 통계를 기반으로 하는 데이터 과학(혹은 빅데이터) 모두 동일하다. - P138

예측은 "맞는 경우"에만 관심이 있지만, 관리는 "맞는 경우"와 "맞지 않은 경우" 모두에 관심을 갖는다. 그렇기에 확률을 잘한다는 의미는 (특히, 위험성에 대한)관리를 잘한다는 의미이다. 예측을 잘한다는 의미로 생각해서는 안된다(보통은 확률을 잘한다고 하면 예측을 잘한다는 의미로 많이들 생각한다). - P139

확률의 본질은 관리 Management이다. - P139

미국에서 스타트업 기업들의 실패를 용인한다는 의미는 그냥 아무 실패나 용인한다는 의미가 아니라, "성공 가능성 (확률)이 높았던" 스타트업 기업의 실패를 용인한다는 것을 의미한다. - P146

너무나도 당연한 이야기이지만, 세상 어떤 곳이라도(스타트업 환경이라도) 실패를 무한정 용인해주는 곳은 존재하지 않는다. 심지어 실리콘벨리에서 조차도 말이다. 그러니 실리콘벨리가 실패를 용인하는 문화라고 하는 이야기는 착각에 지나지 않는다. 좀 더 정확하게는 성공 가능성에 계속해서 투자하는 문화라고 보는 것이 보다 더 정확하다. - P147

확률이 중요한 이유는 미래에 대한 예측이 아니라 관리에 있다고 했다. 이러한 관리 과정을 거친 투자는 결코 도박이 아니다. 현명한 판단을 거친 투자이며, 혹은 재투자이다. 실리콘벨리에서 실패한 기업에게 또다시 투자하는 것은 이러한 확률에 근거한 판단이다. 이러한 확률값은 데이터 사이언스를 포함한 여타 과학적 근거를 기반으로 해서 나왔다. 그래서 도박이 아니다. - P147

데이터 사이언스는 현존하는 다른 기법을 대체하기보다는 다른 분석 기법들을 도와주는 보완재 성격이 강하다. 물론, 다른 기법(혹은 방법론)으로 접근이 불가능하거나 모델링 하기가 어려운 경우 데이터 사이언스 기법들이 대체재의 성격으로 사용되기도 하지만, 생각보다 많은 경우가 해당 분야에 존재하는 기존의 기법을 이용하는 것이 보다 정확하거나 효율적인 분석일 때가 많다. - P153

최근 트렌드(?)가 데이터 사이언스와 인공지능이라 마치 이것들을 이용하면 세상의 모든 문제가 해결될 것 같지만 그렇지는 않다. 오히려 문제가 속한 영역Domain의 실전 경험이 훨씬 중요하다. - P153

데이터 사이언스를 하고자 다양한 도구들을 사용할 줄 아는 것도 중요하지만, 효율적으로 하기 위해서는 최신 데이터분석 도구 대신 문제의 본질에 따라 그에 맞는 적절한 자원과 도구를 분배할 수 있어야 한다. 이것이 데이터 사이언스의 효용성을 높이는 가장 확실한 방법이다. - P155

사실상 데이터 리터러시는 "데이터를 읽을 줄 아는 능력" 정도로 보는 게 맞다. - P156

대부분의 사람들은 어떻게 감성적이 되느냐에 따라 다른 선택을 했다. 그리고 그에 맞는 타당한 논리를 찾으려 했다.
...(중략)...한 학생이 "죽느니, 차라리 위험을 감수하겠노라" 했던 것처럼 말이다. 하지만 위험을 감수하라고 말할 것이 아니라 위험이 무엇인지 정확하게 파악하는 것이 우선이다. - P159

인간은 선천적으로 보이지 않는 위험에 대해서 원래의 위험성보다 무시해서 보려는 경향이 있다. - P160

우리는 정확하게 위험이 무엇인지 그리고 정말 위험한 정도를 파악할 수 있는지 등을 확인하는 능력이 필요하다. 왜곡된 위험에 대해서 합리적인 의심을 하도록 도와주는 것은 감성적인 사고가 아니라 수학적인 사고이다(이것이 필자가 얘기하는 데이터 리터러시다). - P161


댓글(0) 먼댓글(0) 좋아요(10)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo