-
-
시맨틱 웹 - 웹 2.0시대의 기회
김중태 지음 / 디지털미디어리서치 / 2006년 1월
평점 :
절판
웹2.0 기반의 사이트를 만들려고 했는데, 신문이나 사이트를 뒤져봐도 말만 무성할 뿐 실체가 없다.
꼬리를 잡고 잡아 만난 사람이 바로 '김중태'라는 사람인데, 그가 웹2.0에 관한 책을 남겼다.
나는 새로운 패러다임에 대해서 관심이 많다. 그래서 '과학혁명의 구조'라는 책도 좋아하는데, 대학 시절에는 '사이버문학의 도전'이라는 책을 읽고 변화되는 문학의 형식에 대해서 들뜬 마음으로 찾아본 기억이 있다. 하지만 그 책의 저자는 토마스 쿤의 말만 무수히 인용해 놓고, 분명한 흔적을 남기지 않았다.
사실, 문학 앞에 '사이버'라는 수식어는 사치인 것 같다. 저마다 '문학'에 자신의 관점을 덧입히지만, 문학은 문학일 뿐이다.
이 책을 읽으면서 IMF와 FTA를 생각했다. 공장의 노동자들과 농민들이 싸우고 일궈 놓은 터전을 자본은 얼마나 쉽게 빼내갔던가. 우리의 웹 기반도 마찬가지다. 아무리 초고속 인터넷 가입률이 세계 최고이고, 와이브로니 퓨전메모리니 해도 웹 기반에서 뛰어놀 수 있는 신명나는 판을 만들지 않으면 시장을 통째로 빼앗길 수밖에 없다. 김중태라느 사람의 다른 글에 보면 '구글'이 왜 우리나라에서 힘을 쓰지 못하는지 잘 알 수 있다. 네이버나 다음이 구글의 로봇을 철저히 막고 있기 때문이다. 우리나라 대표 포털은 단지 자물쇠만 걸어 놓은 것을 가지고 '경쟁력'이니 설치고 있으니 통탄할 만한 일이 아닐 수 없다. 옛날부터 우리나라는 자기 스스로를 한정하려는 이상한 내력을 가지고 있는데, 국내 시장을 석권하고 나서는 새로운 강자가 나타나 목에 칼을 들이댈 때까지 정신을 못 차리는 경향이 있다.
최근 일주일간(2007.5.25 ~ 2007.5.31), 검색엔진을 통해 내 다음 블로그를 다녀간 방문자는 총 992명인데, 네이버가 605명, 다음이 330명, 엠파스가 55명, 기타가 2명인데, 야후와 구글은 단 1명도 다녀가지 않았다. 포털에서 접근을 막았기 때문이다.
'무한공유'라는 말은 수년 전부터 내 머리속에 각인된 화두이다. 이것은 '오늘날 천재가 태어나지 않는 이유'와도 관계가 있다고 생각하는데, 세상은 점점 복잡해지고 지식은 점점 많아지기 때문에 과거에 비해서 지식의 쓰레기들이 많아져서 천재가 되기도 어려울 뿐만 아니라, 설령 천재가 나타났다고 해서 그를 알아보기도 어렵다. 요즘 세상에 천재를 알아볼 수 있는 사람이 얼마나 되겠는가.
하지만 과거의 모든 정보는 '현재'의 문제에 소용이 되어야 한다. 과거의 정보는 방대하여 어떤 정보가 어디에 소용이 되는지 알기 어려울 뿐만 아니라, 우리는 정보의 쓰레기와도 엄청난 전쟁을 치러야 한다. 만약 정보의 쓰레기를 방치한다면 쓰레기에 노출되는 시간만큼 낭비하게 될 것이다.
그래서 내가 맺은 결론은 '우리들의 DB'를 만드는 작업이다. 파스칼은 말했다. '나의 DB란 없다. 다만 우리들의 DB가 있을 뿐이다'라고* 새로운 사이트에 대한 원칙은 다음과 같다. 이것은 철저히 '나'에 대한 원칙이다.
* 원래의 말은 이렇다. "우리는 '나의 책'이라고 말할 수 없다. 다만 '우리의 책'이라고 말할 수 있을 뿐이다. 내가 썼다는 그 책도 역시 누군가의 책에 나와 있는 것이기 때문이다. (팡세)
1. 내가 그 동안 수집하고 때로는 만들기도 했던 자료를 재분류해서 '정보더미'로 만들고, 이를 공유한다. 우선 신문여행이라는 블로그에 담겨 있는 시사자료 13,000개 가량을 주제별로 세분화해서 재배열한다. 만약 누군가 한 주제에 대한 게시글을 클릭한다면 그와 연결된 다양한 자료를 연결해서 볼 수 있도록 정보더미를 만들고, 다른 사람들도 이 '정보더미'에 참여할 수 있게 권유한다.
2. 공유를 위해서는 게시물의 값을 정확하게 알고 있어야 하며, 특정 게시물이 상위 주제의 어느 부분에 위치하고 있는지 파악해야 한다.
3. 웹 엔트로피(정보 쓰레기)를 줄이기 위해서는 순열식 정보가 아니라 연동식 배치가 필요하므로 필연적으로 거미줄 구조를 가지게 된다. 이를 인드라망(indra network)라고 한다. 즉 연동은 연동값에 따라 위치하기 때문에 특정 주제에 대한 콘텐츠를 찾기가 훨씬 수월해지며, 검색으로 웹 페이지를 지루하게 클릭하는 것보다는 정보에 대한 접근성을 높일 수 있다.
4. 독서행위에서도 태그를 붙여 정보의 값을 매긴다. 이 태그들을 '타당한 위치의 원칙'에 따라 웹의 DB에 축적하고 다른 정보와 연동하여 유기적인 DB화를 실천한다.
5. 유용한 정보를 보았을 때 접수할 수 있는 창구를 만들고, 이를 적절히 배열함은 물론 스스로 배열할 수 있도록 가이드를 마련한다.
김중태의 시맨틱 웹에서 배운 것이 하나 있다. 나는 이제까지 '콘텐츠'를 생산하려고만 했지 그것을 유용하게 구성하려는 데에는 별 관심이 없었던 것 같다. 하지만 구글이나 국내의 포털들이 새로운 콘텐츠를 만들어서 돈을 벌거나 성장한 것은 아니다. 김중태 씨는 주요 신문사의 기사를 구미에 맞게 재배열하는 것만으로도 하나의 회사가 만들어질 수 있다고 말하고 있다.
태그화에 대한 준비는 2003년부터 했던 것 같다. 단지 책에 밑줄을 긋는 것이었다. 내 친구들 중에서도 책을 좋아하는 녀석들이 있는데, 그 친구들이 읽는 책을 나는 평생 읽지 못하고 죽을 수도 있다. 하지만 우리는 책의 전문을 확인하지 않고도 요지를 뽑아낼 수 있다. 주요 부분에 대한 초록이나 리뷰를 가지고도 유용한 정보생활을 할 수 있는데, 전문가들은 정보의 엄밀성만을 너무 강요해 오지 않았나 하는 생각이 든다.
![](http://pds36.cafe.daum.net/download.php?grpid=DUr&fldid=ExU&dataid=9133&fileid=1®dt=20070531180120&disk=10&grpcode=9876&dncnt=N&.jpg)
<태그들1, 교과서, 녹색평론, 장자, 남한산성 등 접하는 모든 장르에 태그를 붙였다. 물론 설정을 위해서 이것저것 붙여놨지만, 개인적으로 독서에 대한 편식은 심한 편이다>
![](http://pds36.cafe.daum.net/download.php?grpid=DUr&fldid=ExU&dataid=9133&fileid=2®dt=20070531180120&disk=11&grpcode=9876&dncnt=N&.jpg)
<태그들2, 이 책 '시맨틱 웹'의 태그들이다. 책 1권에 대충 30개 정도의 태그가 붙는다.>
![](http://pds33.cafe.daum.net/download.php?grpid=DUr&fldid=ExU&dataid=9133&fileid=3®dt=20070531180120&disk=30&grpcode=9876&dncnt=N&.jpg)
<태그들3, 문구점에 가면 태그용 포스트?堧? 파는데, 흰면에는 쪽수를 쓰고, 드러난 면에는 키워드를 쓴다. 쪽수를 쓰는 이유는 나중에 떼졌을 때 다시 붙이기 위해서다. 본문에는 연필로 범위를 표시하고 밑줄을 치기도 한다. 연필을 쓰는 이유는 책에 대한 최소한의 예의이다. 좀더 나쁘게 말한다면 헌책방에 책을 팔 때 형광펜이 쳐져 있으면 값이 좀 떨어진다고나 할까>
목적 없이 붙여왔던 태그가 이제는 분명한 목적이 생긴 만큼, 태그의 체계를 어떻게 할 것인가, 태그의 위치를 어떻게 정할 것인가, 노출은 어떻게 할 것인가, 본문은 어떻게 활용할 것인가, 요약문을 따로 만들 것인가 등 구체적인 문제에 대해서 고민을 해야 한다. 김태중 씨의 책에서도 공용 태그니 스마트 태그니 많은 용어를 쓰는 것을 보면, 태그가 중요하긴 중요한 모양이다.
나도 사람인지라 이 세상의 정보에 태그를 붙여, 크고 근사한 정보더미를 만들고 싶은 욕구가 왜 없겠냐마는 나와 내 주변의 정보들 먼저 추스리려 한다. 만약 내가 만들어낸 정보가 근사하다면 누군가는 동참하고 싶어질 것이고, 이렇게 하나 둘 모이다 보면 강력한 정보의 지도가 만들어지지 않을까 몰래 생각할 뿐이다.
물론 프로그래머와 이 일을 함께 할 예정인데, 시간이 오래 걸리는 일이라고 한다. 정 안 되면 '링크'를 다닥다닥 붙여서라도 모델을 한번 만들어봐야겠다. 솔직히 나도 그 '정보더미'가 무척이나 필요하기 때문이다. 요즘 이 생각에 빠져, 밤에도 잠이 안 온다.