-
-
당신이 알고 싶은 음성인식 AI의 미래 - PC, 스마트폰을 잇는 최후의 컴퓨터
제임스 블라호스 지음, 박진서 옮김, 장준혁 감수 / 김영사 / 2020년 1월
평점 :
🎚당신이 알고싶은 음성인식 AI의 미래🎚
pc, 스마트 폰을 잇는 최후의 컴퓨터
⠀
인공지능 AI / artificial intelligence 는 컴퓨터가 사람의 지능이 할 수 있는 사고, 학습, 모방,자기계발등을 하는 것을 의미합니다. 인공지능은 알파고를 통해 전세계의 관심을 받고 점점 급속한 발전을 하고 있습니다. 인공지능 AI는 음성인식에도 접목할 수 있는데요. 우리 주변에서 제일 가깝게 친숙한 음성인식 AI는 뭐가 있을까요? 바로 아이폰의 시리, 갤럭시의 빅스비등이 있습니다. AI 스피커와 음성지원은 사람과 기술간의 상호작용 및 제어방식을 크게 바꾸겠죠? 참 깜빡했는데 당신이 알고 싶은 음성인식 AI의 미래 책은 아마 음성인식AI에 관련되어 알고리즘을 소개하는 책과 다르게 역사와 배경, 미래 발전 방향에 대한 통찰을 이야기 한 책으로는 유일할 거라 합니다.
⠀
음성인식 AI 하면 사람의 말투, 속도, 사투리등을 어디까지 인식할 수 있을까가 나는 제일 궁금했었다. 나만 궁금한건 아니겠지만 또 AI의 한계, 미래의 방전 가능성등 역시 궁금하지 않다면 거짓말이다. 책을 통해 조금 해결되긴 했지만...심지어 난 AI가 발전가능성이 있고 미래 사업으로도 수직상승이라 해도 별 반응을 하지 않고 아 그렇구나 하던 사람이였다. 왜냐고? 내 폰을 앞에 두고 '하이 빅스비'라고 말하면 뜨는 빅스비는 내가 사투리를 쓰지않아도 문장 텍스트를 제대로 쓰지도 알아듣지도 어플 실행도 제대로 하지않아 음성인식 AI는 별로 신뢰가 없으니까. 핸드폰이 없으면 안되는 전세계 사람들이 핸드폰의 음성인식 시리와 빅스비를 얼마나 사용할까? 사실 시리와 빅스비를 통해 무언가를 지시하는거보다 바로 스스로 행동하는게 빠르지 않을까?
⠀
"더 이상 죽음을 피할 수 없을때, 우리의 마음은 기계에 업로드 되어 몸이 흙으로 변한지 오랜 시간이 지난 후에도 실리콘 속에서 살게 될 것입니다."
문장을 보고 섬뜩한 느낌부터가 들었다...
⠀
🔖프로그래밍과 마술에 대한 재주와 더불어 체이어는 최고의 자기수양 전문가들의 캐치프레이즈에 필적하는 자신만의 동기부여 구호를 만들었다. 그것은 바로 '말로 천명한 목표' 즉 VSG였다. 이런 목표를 위해 그는 인생의 중요한 시점에서 경험하는 핵심 감정에 초점을 맞추었다. p.50
⠀
🔖음성 인터페이스 시연은 처참하게 실패했다. 시리는 음성인식을 다른 회사의 기술에 의존했다. 정말로 타이밍이 나빴는지 그 회사는 애플 시연 당일에 기술적 문제를 겪고 있었다. 키틀러스는 '그건 회사 역사상 단연 최악 데모였습니다.'라고 말했다. 그는 시리에게 컵스 경기 티켓 두장을 구해줘 라고 말했고, 시리는 이 말을 서커스가 다음주에 마을에 올 것이라고 해석했다. p.67
⠀
🔖거대 회사들은 사람들이 기계와 대화하는 2가지 방법을 상상하고 있는 것이 분명해졌다. 첫번째는 확실히 음성이었다. 또 하나의 방법은 텍스트였다. p.75
⠀
🔖시리와 관련한 가장 큰 뉴스가 애플에서 일어나지 않은 이유는 따로있다. 시리의 최초 개발자 3인은 회사를 설립하고 새로운 가상 비서를 만들었다고 발표했다. 가상 비서의 이름은 삶을 의미하는 라틴어를 딴 비브였다. p.95
⠀
🔖시리는 이제 발음과 억양이 복잡한 언어를 20개 이상 구사한다. 그러므로 이제 기술업계가 서둘러 수용하려는 더욱 자동화되고 개선된 음성합법 기법이 무엇인지 집작 할 수 있을것이다. 바로 딥러닝이다. p.167
⠀
🔖아리스토는 아인슈타인이 아니다. 그러나 뉴욕주에서 4학년 과학 리젠트 시험을 치렀을때, 아리스토는 71%의 질문에 정확한 답을 맞혔다. 클라크의 목표는 아리스토가 대학 수준의 생물 교과서를 읽고 그 내용에 대한 질문에 답 할 수 있게 하는 것이다. 보다 광범위하게는 자신의 시스템이 구현하는 더 깊은 이해의 유형이 더 널리 퍼져 음성 AI가 더욱 지능적으로 대화 할 수 있기를 바란다. p.231
⠀
🔖도구이자 유사존재로 우리 삶에 들어온 음성 AI는 여러 경계를 모호하게 한다. 사생활, 자율성, 친밀함의 경계를, 인간관계와 디지털 관계, 사실과 허구, 삶과 죽음의 장벽을 모호하게 한다. 이런 모든 변화에는 기회와 위험이 뒤섞여있다. 그러므로 음성 AI는 수동적으로 수용하기보다는 적극적으로 고려해야할 대상이다. p.233