관리 메뉴

지구별에서 - Things Old and New

1 bit 란? - "The Information" by James Gleick 본문

1 bit 란? - "The Information" by James Gleick

샛솔 2011. 11. 30. 22:56

1 bit 란? - "The Information" by James Gleick

 

 

오늘날 bit 란 말을 쓰지 않는 사람은 없을 것이다.  <내 아이폰은 32 기가 메모리 짜리>라든가  내 핸폰은 <월 520 메가 데이터 용량제에 가입했어>라든가 일상적으로 쓰는 말이다.   그 말은 아이폰에 32 Giga Byte 메모리를 장착했다는 뜻이고 Byte 는 8 bit에 해당되니 32 x 8 x 10^9  bits 메모리가 내 아이폰에 들어 있다는 뜻이다.   데이터 용량은 요금을 지불하는 통신사의 통신망을 통해서 월 520 x 8 x 10^6  bits 까지 사용할 수 있다는 뜻으로 쓴다.

 

그러나 막상 <bit 가 뭐야>하고 물으면 명쾌히 대답할 수 있는 사람은 많지 않을 것이다.   

 

1948년 Bell 연구소의 수학자 Claude Shannon 은 통신의 수학적 이론 (A Mathematical Theory of Communicatin) 이란 기념비적 논문을 썼다.   여기서 처음으로 정보의 용량 단위로 bit 라는 낱말이 쓰이고 되고 오늘날 일상어가 되어 버린 것이다.

 

 <카오스>의 저자로 잘 알려진 제임스 그레이크가 또 다시 과학 해설서를 써 냈다.   

 

<카오스>는 "카오스"를  일반 대중의 일상어로 승격시킬 만큼 지대한 영향력을 행사한 저작물이다.   

 

반면 이 번에 펴 낸 <정보(The Information)>는 일상어가 되어 버린 bit 와 같은 정보 개념을  Shannon 의 논문에서 시작해서 그 역사,   이론,  그리고 정보에 넘쳐나는 정보 과잉시대를 파헤쳐 일반 대중에게 설명하고 있다.

 

 

 

 

제임스 그레이크의

<The Inforamtion>

 

 이 책을 읽어 보니 내가 30여년전에 쓴 논문이 생각이 났다.

 

30 여년전 내가 한글 학회에서 강연을 한 일이 있다.   그 제목은 <정보이론적 측면에서 본 소리말과 글자> 였다.  한글학회 이사였던 친구이기도 동료이기도 한 언어학과의 L 교수가 나를 초청해서 강의를 했던 것이다.

 

물론 청중은 한글 학회 회원이 많았지만 일반에게도 공개한 공개강연이었기에 수학은 될 수 있으면 뺀 정보이론의 골자를 소개하고 이 이론에 근거하여 어떤 글자체계가 가장 효율적인가를 설명한 내용이었다.

 

강연으로 끝내는 줄 알았더니 강연내용을 한글학회 회지에 싣겠다고 논문 형식의 원고를 써달라고 하는 것이었다.  이 원고와 1981년 12월 3일자로 간행된 한글학회지 제 173호에 논문으로 실렸다.    내가 물리학과는 거리가 좀 있는 분야에 대해서 쓴 유일한 논문이다.

 

"정보이론적 측면에서 본 소리말과 글자" 를 구글로 검색하니  회지의 제목만은 보인다.

 

 

 

구글 검색하니 내 논문의 타이틀이 보인다.

 

 

한 때 내가 가르친 열 및 통계를 "정보이론적 접근법" 으로 가르치기도 해서  당시 한국에서는 "정보이론"을 나 보다 더 많아 아는 사람은 몇사람 없었을 것이다.      물리학을 전공했다 해도 "정보이론" 이니 엔트로피니 하는 개념을 잘 이해하는 사람은 많지 않다.   그만큼 어려운 개념이기 때문이다.

 

그러니 아무리 Gleick 라 해도 그 개념을 일반 독자에 전달하기란 쉽지 않았을 것이다.   자신의 이해 수준도 책을 쓰기엔  이해의 한도가 있었을 것이다. 

 

비록 일반 대중을 위한 책이긴 하지만 결코 이 책은 쉽게 이해하기 어려울 것이다.    얼마전에 읽은 호킹의 <위대한 설계>도 쉬운 책이 아니었지만 이 책도 그 중간 부분이 되는 이론은 열역학이니 엔트로피니 하는 어려운 개념들이 나와 일반 독자에게는 아마도 쉽게 이해가 가지 않을 지 모른다.  

 

단지 Gleick 는 어려운 주제를 대중이 쉽게 이해할 수 있게 쓰는 글 재주가 있어  읽기가 편할 지 모르지만 이런 경우 독자는  이해했다고 해도  그 이해의 깊이는 독자의 물리학이나 정보이론의 배경에 따라 다를 것이다.   

 

한글학회에서 내가 강연한 내용도 이 책의 중간 부분에 있는 이론부분과 겹치는 부분이 많다.    나 역시 이 책과 마찬가지로 일반 대중에게 bit 라는 개념을 설명하려고 애썼다.

 

그 글에서 소리말은 한 번 송신되면 사라지는 (적어도 축음기와 같은 녹음 장치가 발명되기전에는) 반면 글말은 반영구적이라 지적했는데  내 강연내용이 그 때 강연으로 끝났다면 아마도 지금은 까맣게 잊혔을 터인데 논문으로 발표되어 아직도 남아 있다.  

 

아직도 책꽂이 꽂혀 있는 이 학회지를 스캔해서 여기 올린다.

 

모두 29쪽이라 스캔한 페이지를 모두 올 릴 수 없어 알집으로 묶어 올린다. 

 

아래 부분은 서론으로 bit 라든가 Shannon 의 정보 이론을 간단히 소개하고 있다. 

 

 

 

 

 

정보의 정량화와 관용단위,  bit

 

 

 

정보이론의 간략한 소개

 

 

 

 

정보의 전달,  통신의 구조

 

 

 


Gleick 의 책에는 따로 언급이 없지만

Shannon 의 논문의 핵심은 Coding Theorem이다.

 

 

 

이 논문은 Shannon 의 이론에 바탕을 두고 "한글"과 같은

소리글이 얼마나 효율적인 부호화 체계인가를 보이기 위해서 쓴 것이다.

당시만( 70 년대 말) 해도 한자 혼용론,  초등학교의 한자 교육 부활 주장등이 기승을 부릴 때라

L 교수가 내게 강연을 권유했던 것 같다.

내가 사석에서 정보이론 이야기를 많이 했던 것 같다. 

 

정보이론적측면에서본소리말과글자.zip


 

 


Comments