언어법칙에 기초한 번역 vs. 예측에 기반한 번역
- 번역의 돌파구

번역의 사례에서 전문가들은 자동번역을 예측의 문제가 아닌 언어의 문제로 보았다. 기존의 언어적 접근은 사전을 이용해 한 단어씩 문법적 규칙과 결부시켜 번역하는 방식이었다. 일종의 만족화였다. 하지만 그렇게 하면 ‘이프‘가 너무 많아 결과가 시원치 않았다.

그러나 어느 순간 한 문장이나 한 문단씩 번역할 수 있다는 사실을 깨닫게 되면서 번역은 예측 문제가 되었다. 예측 기계로 번역하는 과정에는 다른 언어에서 적절한 대응 문장을 예측해 찾아내는 일이 포함된다. 통계학 덕분에 컴퓨터는 ‘이프‘를 예측해 가장 좋은 번역을 선택할 수 있다. 즉 데이터에 있는 대응 번역을 토대로, 전문 번역가라면 어떤 문장을 사용할지 가장 가능성이 높은 문장을 예측하는 일이다. 의외로 그것은 언어 법칙에 의존하지 않는다. - P152


댓글(0) 먼댓글(0) 좋아요(4)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 

예측과 판단의 차이.
인공지능의 높은 예측력.
인간 판단의 가치 증가.
......인공지능에 의한 인간 판단의 예측

결정은 대부분 복잡하고 쉽게 코드화할 수 없는 판단을 거쳐 나온다. 하지만 그렇다고 해서 앞으로도 이런 결정을 내릴 때 여전히 인간이 주축이 된다는 보장은 없다. 자율주행 차량과 마찬가지로, 기계는많은 사례를 관찰함으로써 인간의 판단을 예측하는 법을 배운다. 그래서 예측 문제는 이런 것이 된다. 입력 데이터가 주어질 때, 인간은 어떻게 하는가?"
- P134

예측 기계는 판단해 주지 않는다. 판단은 인간만이 한다. 인간만이달리 행동했을 때의 상대적 보상을 표현할 수 있기 때문이다. 인공지능이 예측을 떠맡게 되면 인간은 의사결정에서 예측 판단을 결합하던 정해진 방식을 지양하고 판단하는 역할에만 좀 더 집중할 것이다.......
예측이 더 정확하면 다양한 행동에 대한 보상을 생각할 기회가 많아진다. 즉 판단의 기회가 많아지는 것이다. 다시 말해 예측이 정확해지고 더 빠르고 더 값싸지면 더 많은 결정을 내릴 수 있다. - P117

여기서 행동은 우산을 들고 가는 것이고, 예측은 비가 오거나 맑다는것이며, 결과는 젖거나 젖지 않는 것이고, 판단은 젖거나 젖지 않은 데서 느끼는 행복(‘득실‘)에 대한 예상이다. 예측이 더 좋아지고 더 빨라지고 더 값싸지면서, 우리는 더 많은 결정에서 더 많은 예측을 활용할 것이고 따라서 인간의 판단이 더 많이 필요해지고 그럼으로써 인간이 내리는 판단의 가치는 상승할 것이다.
- P115


댓글(0) 먼댓글(0) 좋아요(4)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 

인간과 기계는 예측을 잘하는 분야가 서로 다르다. 병리학자가 암이 있다고 말하면 대체로 틀림이 없었다. 인간이 암이 있다고 판정했는데 암이 아닌 경우는 드물었다. 반대로 인공지능은 암이 없다고 말할때 훨씬 더 정확했다. 인간과 기계는 실수하는 유형이 달랐다. 이렇게인간과 기계는 서로 다른 능력을 인정하고 손을 잡음으로써 각자의 약점을 극복했고 그래서 오류율을 크게 줄였다.
이런 협업을 사업에 어떻게 적용할 것인가? 기계 예측은 두 가지 경로를 거쳐 인간의 예측 생산성을 향상시킬 수 있다. 첫째는 기계가 먼저 예측을 내놓는 방법이다. 그러면 인간은 이를 이용해 자신의 평가와 종합한다. 둘째는 기계가 사후에 다른 의견을 제시하는 방법이다. 즉 기계가 인간의 작업을 감시하는 식이다.  - P97


댓글(0) 먼댓글(0) 좋아요(5)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 

‘딥러닝‘ 이라 불리는 최근의 발전의 토대가 되는 핵심 기술은 역전파hback propagation라는 방식이다. 역전파는 사례를 통해 배운다. 자연 두뇌와 비슷한 방식으로 번거로운 모든 절차를 피하는 것이다. - P61

아이에게 ‘고양이‘라는 단어를 가르치고 싶다면 고양이를 볼 때마다 그단어를 말해 주면 된다. 머신러닝도 기본적인 원리는 같다. 머신러닝에고양이‘라는 라벨이 붙은 고양이 사진을 무수히 입력하고 또 고양이 라벨이 붙지 않은 고양이가 없는 사진을 무수히 입력한다. 그러면 기계는 고양이‘라는 라벨과 관련된 픽셀의 패턴을 인식하는 법을 배운다.
- P61

이제 문제는 알고리즘 문제(고양이의 특징은 무엇인가?)에서 예측 문제(라벨이 없는 이 사진에는 내가 전에 봤던 고양이의 특징이 있는가?)로 바뀌었다. 머신러닝은 확률 모델을 사용해 문제를 해결한다.
- P61


댓글(0) 먼댓글(0) 좋아요(6)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 

머신러닝이든 고전적 회귀이든 당시 가장 좋은 방법은 직관과 통계 실험을 함께 사용해 변수와 모델을 선택하는 것이었다. 이제 머신러닝 기법, 특히 딥러닝 기법은 모델에 유연성을 허락한다. 이 말은 변수가 예기치 않은 방식으로 서로 결합할 수 있다는 뜻이다. 청구하는 달의 이른 시기에 기본 통화 시간을 다 사용해 통화 요금이 많이 나오는사람은 늦게 통화 시간을 채워 요금이 많이 나오는 사람보다 이탈할 가능성이 적다. 아니면 주말 장거리 통화 요금이 많이 나오면서 요금을연체하고 문자를 많이 보내는 사람은 특히 이탈할 가능성이 높다. 이런 조합은 예상하기가 어렵지만 예측에는 큰 도움이 된다. 이런 조합은 미리 알기 어렵기 때문에 표준 회귀 기법으로 모델을 만드는 사람은 예측할 때 이런 것들을 포함시키지 않는다. 하지만 머신러닝은 프로그래머가 아닌 기계에 어떤 조합과 어떤 상호작용이 중요한지 선택할 수 있는여기를 준다.
- P58

2008년의 금융위기는 회귀 기반의 예측 방식이 대실패를 맛본 사건이었다. 사태가 위기로 치닫게 된 것은 부채담보부증권collateralized debtohlizations, 즉 CDO의 상환 가능성을 예측하지 못한 탓이 컸다. 2007년에스탠더드앤푸어스 Standard & Poor‘s 같은 신용평가 기관은 AAA등급 CDO가 5년 뒤에 수익을 내지 못할 확률을 800분의 1미만으로 예측했다. 그러나 5년 뒤에 수익을 내지 못한 CDO는 네 개 중 하나 꼴이었다. 채무불이행에 대한 과거 자료가 풍부했음에도 불구하고 그들의 초기 예측은 크게 빗나갔다.

실패의 원인은 자료 부족이 아니라 분석가들이 예측을 하기 위해데이터를 사용한 방식에 있었다. 신용평가 기관들은 다중회귀 같은 모델을 근거로 예측을 내놓았는데 그 모델은 여러 시장의 주택 가격이 아무런 관련이 없는 것으로 추정하고 있었다.  - P59

분석가들은 그들이 중요하다고 믿은 것에 대한 가설을 근거로 회귀모델과 방법론을 만들었다. 사실 그런 믿음은 머신러닝에는 불필요한것이었다. 머신러닝 모델은 많은 변수 중에 어떤 것이 가장 잘 작동할지 판단하고, 중요한 것과 중요하지 않은 것을 구분하는 일에 특히 능숙하다. 이제 한 분석가의 직관과 가설은 그다지 중요하지 않다. 이런식으로 머신러닝은 라스베이거스와 피닉스와 마이애미의 주택 가격이함께 움직일 수도 있다는 사실을 포함해, 예기치 못한 여러 가지 상호관계를 근거로 정확한 예측을 할 수 있게 해 준다.
- P59


댓글(0) 먼댓글(0) 좋아요(6)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo