앞의 글에 이어서 과연 개인의 자료를 어떻게 보존할 수 있을지 생각해보겠습니다. 앞서도 말씀 드렸지만 무수한 논의들이 존재할 뿐 어떻게 해야한다는 확실한 답은 아직 존재하지 않습니다. 따라서 이 글에서 던지는 질문들을 한 번씩 생각해 보시고 나름대로 판단하셔야겠지요. 그리고 이 글에서 말씀드리는 보존은 한,두달 혹은 1,2년을 보관하자는 것이 아니라 10년에서 20년 길게는 100 년이상 디지털 자료를 이용 가능한 상태로 보존하는 문제에 대한 것입니다.과연 내 손자/손녀가 내가 지금 만들고 있는 이 얼음집 블로그를 볼 수 있을지... 여러분은 어떻게 생각하십니까? 가능할까요? 우선적으로 이 문제는 이글루스 서버를 운영하시는 분들에게 달려있습니다. 50년 후 100년 후까지 서비스를 계속해 주시기 바랍니다만 혹시 그렇지 않을 수도 있으니 이용자 스스로 대비할 필요가 있지요. 예전 네티앙이라는 서비스가 사라지면서 그 안에 있던 이용자들의 중요한 자료도 같이 사라졌다고 들었습니다. 만일 이글루스가 그런 식으로 사라진다면... 글쎄요.
앞서도 말씀 드린 이야기이지만 디지털 자료는 이용이 편한 만큼 약하고 예민한 자료입니다. 세종실록 지리지 에서 49 페이지가 찢어졌더라도 50페이지 셋째줄은 읽을 수 있습니다. 하지만 파일로 저장된 상태에서는 49페이지 셋째 줄에 한 자만 상처를 입어도 세종실록 지리지는 물론 세종 실록 전체를 읽을 수 없는 사태가 벌어질 수 있습니다. 그리고 세종 실록을 찢거나 불태우는데는 시간이 걸리지만 컴퓨터에서 파일을 지우는데는 0.001초의 클릭이면 충분 합니다. 따라서 이러한 디지털 자료를 보존한다는 것은 말처럼 쉬운 일이 아닙니다.
옆에 보시는 그림은 장치별 최대 저장 기간을 나타낸 표입니다. 아직까지는 많이 사용되고 있는 플로피 디스크는 빠져 있는데 다른 자료를 보니 플로피 디스크의 저장 기간으로는 3년에서 5년을 최고로 잡더군요. 옆의 자료에서 제시된 보존 기간 중 일부는 추정치일뿐 실제로는 다를 수가 있습니다. 그리고 CD의 경우처럼 5년에서 100년이라는 이해하기 힘든 수치가 나오기도 합니다. 그 이유로는 CD의 자료 저장면에 쓰인 물질, 그리고 표면 처리 방법에 따라 차이가 있고 또 보관 조건에 따라 차이가 많이 난다고 합니다. 일반적으로 전문가들은 골드 CD가 그나마 저장 기간이 길다고 하고 CD-RW나 DVD-RW 같은 경우는 저장 기간이 일반 CD-ROM 의 25%로 정도 밖에 되지 않는다고 합니다. 그리고 같은 크기의 디스크에 더 많은 자료가 저장되는 DVD가 CD에 비해 훨씬 외부적인 충격에 약하다고 합니다. 아래에는 일반인들이 가장 많이 쓰고 있는 CD 나 DVD를 제대로 보관하기 위해 전문가들이 권고하는 몇 가지 사항들입니다.- 먼지 없고 시원하고 어두운 곳에 보관하십시오 그리고 보존에 가장 적정한 온도는 17도에서 20도 사이에 습도는 40% 정도입니다.
- CD 근처에서는 절대 금연입니다. 담배연기의 입자도 저장면에 손상을 입힐 수 있습니다.
- 디스크를 만질 때는 가운데 구멍이 있는 부분이나 모서리를 이용해야 합니다. 그리고 가장 좋은 방법은 보푸라기가 일지 않는 장갑을 끼고 만지는 것입니다.
- 보관은 반드시 플라스틱 재질의 케이스에 넣어 세로로 세워 보관하십시오. 사진 앨범식으로 된 CD 보관자켓은 디스크를 넣고 뺄 때 디스크의 표면에 상처를 줄 수 있습니다.
- 보존을 위해서는 사용을 취소한으로 줄이고 만일 디스크를 사용을 하게 된다면 사용하고 난 후 즉시 케이스로 옮기십시오. CD 드라이버에 장기간 넣어두지 마십시오.
- 공디스크는 반드시 사용하기 직전에 케이스에서 꺼내십시오.(참고로 공디스크의 경우 사용 가능한 기간은 보관 조건에 따라 5년에서 10년 정도로 잡고 있습니다.)
- 한 번 레이블을 붙였으면 다시 떼내거나 옮기기 마십시오.
하지만 이러한 하드 웨어의 문제는 저장된 자료를 읽을 수 있는 소프트웨어의 문제와 겹쳐 지면 상당한 고민거리가 됩니다. 보석글의 예에서도 말씀드렸지만 지금 많이 쓰고 있는 아래아 한글이나 마이크로소프트 오피스 같은 프로그램이 50년 뒤 혹은 100년 뒤에까지 존재한다고 확신할 수 있는 사람은 아무도 없습니다. 그리고 지금 쓰고 있는 윈도우즈 운영체제가 100년 후에도 그대로 유지되리라고 믿으시는 분은 없으리라 생각됩니다. 그렇다면 이런 자료들을 어떻게 관리해야 할까요?전문가들이 이야기 하고 있는 첫 번째 방법은 자료를 원본 그대로 유지하고 이것을 읽을 수 있는 하드웨어와 소프트웨어도 같이 보존하는 방법입니다. 하지만 장기적인 시작으로 볼 때 얼마나 오랫동안 그것이 가능할런지 그리고 새로운 방식으로 저장되는 자료들이 나올 때마다 그 자료들과 관련된 하드웨어와 소프트웨어를 같이 보존한다는 것은 쉬운일이 아닐 것 같습니다.
두번째로 이야기하는 방법은 새로운 포맷으로 자료를 계속해서 변환시키는 일입니다. 즉, 한글 2.5 로 만들어진 문서는 한글 3.0이 나오면 다시 3.0 방식으로 저장하고 한글 96이 나오면 다시 그 방식으로 저장하는 일을 계속적으로 반복하는 일입니다. 그렇게 하면 적어도 최신의 소프트웨어로 언제나 읽을 수 있는 상태로 자료를 보존할 수 있게 됩니다. 물론 자료의 양이 많아질수록 이 일은 점점 더 힘들어 지겠지요. 하지만 미국의 경우 많은 기업체와 정부 기관에서 이러한 방식을 채택하고 있습니다. 그나마 자료의 내용을 계속적으로 이용 가능한 상태로 보존할 수 있는 가장 확실한 방법이니까요.
또 다른 주장을 하는 사람들은 과거의 소프트웨어와 하드웨어를 흉내내는 에뮬레이터를 만들어서 과거의 자료들을 읽어내자고 합니다. 예전 전자 오락실에서 하던 갤러그나 너구리 같은 게임을 일반 PC에서 즐길 수 있게 만들어 주는 MAME 같은 프로그램이 한 예가 되겠지요. 하지만 자료의 장기간 보존이라는 측면에서 볼 때 이 에뮬레이터는 소프트웨어 뿐만 아니라 운영체제까지 실행할 수 있도록 설계되어야 하고 아직 확실한 검증을 거친 에뮬레이터는 존재하지는 않습니다.

이와 함께 한 가지 생각해 볼 것이 자료를 저장할 때 사용하는 포맷의 문제입니다. 즉, 특정한 회사의 소프트웨어로 만들어져서 해당 소프트웨어가 없으면 읽지 못하는 자료, 예를 들면 DOC, HWP, 나 PSD 같은 포맷은 그 소프트웨어 회사가 없어지면 자료 역시 위험에 처할 수 있습니다. 하지만 가장 기본적인 포맷, 소프트웨어에 큰 구애를 받지 않는 포맷으로서 흔히 말하는 오픈 소스로 제작된 자료는 상대적으로 이러한 위험에 덜 노출되어 있습니다. 이것과 관련하여 플로리다 디지털 아카이브 에서 추천하는 보존용 파일 포맷은 아래와 같습니다.(참고로 보십시오.)
- 텍스트 - *.txt, *.xml, *.pdf
- 이미지 - *.tiff, *.png, *.svg
- 오디오 - *.aiff, *.wav
- 비디오 - *.mj2(Motion JPEG2000), *.avi, *.mov(Motion JPEG)
- 스프레드시트 - *.txt, *.csv(Delimited text), SQL DDL
그런데 제가 개인적으로 가장 선호하는 자료 보존 방법은 매우 원시적인 것입니다. 주로 다루는 자료가 문서 자료이다 보니 중요한 자료는 프린트해서 보관합니다. 적어도 종이는 인류가 몇 천년간 오래 사용해온 매체이고 자료 보존 능력이 이미 실증된 것이기 때문에 제게 정말 중요한 자료는 종이로 보관합니다. 그리고 특히 도서관에서 학위 논문을 준비하고 있는 학생들에게는 반드시 그날 그날 써내려간 논문을 인쇄해놓으라고 충고합니다. 짧게는 몇 달, 길게는 몇 년 동안의 작업이 일순간의 실수로 날아갈 수 있기 때문에 저장을 하는 것도 여러 곳에 하고 반드시 인쇄해서 종이를 보관하는 것이 안전하다고 충고합니다. 사실 제가 이글루스를 선택한 이유 중의 하나는 바로 PDF 파일 백업과 블로그의 내용을 책으로 만들어 내는 서비스 때문이었습니다. 힘들게 올린 글이 누군가의 실수로 서버에서 다 사라진다하더라도, 또 (물론 그러지 않기를 바라지만)이글루스 서비스가 50년후에 없어진다고 하더라도 제게는 인쇄한 PDF 파일이 종이에 남아있고 그것은 아마 50년 후에도 제 손자가 여전히 읽을 수 있을 것이기 때문입니다.
* 이 글을 위해 참고한 자료들과 이미지의 출처입니다.
- NIST ITL Digital Data Preservation Program
- FCLA-Digital Archive:Digital Archive Information
- Michael W. Gilbert , Digital Media Life Expectancy and Care
- Digital Preservation Tutorial from the Cornell University (디지털 자료 보존에 대해 관심이 있으신 분들은 꼭 방문해 보십시오.)
- Preserving Access to Digital Information (PADI), from the National Library of Australia.
- Digital Preservation from the Library of Congress
- TODAYS CARTOON by Randy Glasbergen




덧글
MD-egg 2006/12/01 16:59 # 답글
으으… ODD에 저장했던 것들 중 얼마가 1년만에 날아가버린 경험을 한 저로서는 남의 이야기처럼 들리지 않네요. Digitailzed Data는 정말, 알게 모르게 상당히 fragile한 것 같아요.
Charlie 2006/12/01 17:46 # 답글
프레젠테이션같은데 쓰는 중요한 자료는 최소한 5가지로 보관합니다. 하드드라이브, CD, Flash Drive, 인터넷(웹하드, gmail...), 그리고 하드카피로요.딱 한번, gmail에 보험들듯이 보내놨던 자료만 빼고 다 문제가 생긴이후로 버릇처럼 하고 있지요. ;;;
참, 그리고 한글 파일의 경우 *.txt 포멧이라고 해도 여러가지 방식차이가 있어서 까다롭더라고요..
MistiLine 2006/12/01 18:30 # 삭제 답글
공감이 가는 글이군요. 보관할 만한 것들만 죄다 모아서 *.txt 포멧으로 보관하고 있기는 한데, 윗분 말씀처럼 그 형식의 차이가 있는 것 같더라구요.
도라도리 2006/12/02 01:03 # 답글
그러군요......저도 파일 몇번 날린 후로는 3~4군데에 따로 보관 하고 있기는 합니다만...워낙 이런분야를 모르다보니 파일포멧도 생각해야 하는건 처음 알았네요..
유익한 글 잘 읽고 갑니다..
Clio 2006/12/02 04:43 # 답글
MD-egg 님/ 중요한 자료들이 아니었기를 빕니다. 아픈 경험을 겪지 않고 교훈을 얻으면 좋은데... 아픈 만큼 성숙해지겠지요. ^^Charlie 님/ 많은 곳에 저장하면 할 수록 안전하다고 하더군요, 'Redundancy"라는 개념을 이 경우에는 긍정적으로 생각해도 좋을 것 같습니다.
MistiLine 님(그리고 Charlie 님)/ 맞습니다. 완성형, 조합형 해서 한동안 이야기 하는 것들을 보았었는데 자료 보존의 경우 문제가 되겠군요. 더구나 한자와 한글이 혹은 영어나 불어, 러시아어 등이 한 문서안에서 같이 쓰이고 있는 경우는 더욱 문제가 복잡해지겠습니다. 늦기 전에 이런 디지털 자료 보존에 대해서 한국에서도 좀 더 연구하시는 분들이 나와야 할 텐데요.
도라도리 님/ 저도 문과 출신이라 기술적인 부분에 대해서는 들은 풍월뿐입니다. 당장 보관하는 것도 중요하지만 훗 날을 생각한다면 제대로 이용할 수 있는 상태로 보존하는 것도 중요할 것같아 올린 글입니다. 자주 들리셔서 좋은 의견 남겨 주십시오.
marlowe 2006/12/04 16:58 # 답글
주제에서 벗어난 이야기이지만, 언젠가는 감정과 기억도 지우거나 리셋할 수 있는 날이 오지 않을까요?
Clio 2006/12/05 06:38 # 답글
marlowe 님/ 흥미로운 질문입니다. 최근 어디에선가 들은 이야기인데 인간의 두뇌에 이식할 수 있는 컴퓨터 칩 아니면 적어도 생각의 힘으로 움직이는 컴퓨터를 연구한다고 하는군요. 만일 이런 것이 점점 더 발전할 경우 경우 감정은 모르겠지만 기억도 리셋하는 날이 오지 않을까요? 짐 캐리가 주연한 최근 영화 "Eternal Sunshine of the Spotless Mind" 가 생각납니다.. 그러고보니 기억이 사라지면 감정도 사라지는 것 같은데... 하지만 기억과 감정에 관한 한 인위적인 어떠한 개입보다는 자연스럽게 놔두는 것이 제일 나을 것 같기도 합니다. 또 다른 한 면으로는 전쟁이나 폭력 등의 나쁜 기억으로 부터 고통받고 있는 사람들의 경우, 이러한 나쁜 기억들만을 지울 수 있다면 심리적인 안정을 찾는데 도움이 될것도 같네요. 흥미롭습니다. 좀더 생각해 봐야겠군요..
isanghee 2006/12/06 00:57 # 삭제 답글
예전부터 고민하던 것들을 잘 정리해주셨네요. 아직까지는 역시 종이가 가장 확실한 선택 같습니다.다만, 몇 번 이글루스 pdf 서비스를 이용했었는데 제 블로그 특성상 사진이 많이(?) 필요하기 때문에 기계적으로 pdf 변환하게 되면 레이아웃이 어설프거나 깨지게 되더군요. 그렇다고 하나하나 편집하는 것은 너무 품이 많이 들구요. 고민입니다.
Clio 2006/12/06 06:30 # 답글
isanghee 님/ PDF 변환에 대해 저와 같은 고민을 하고 계시는 군요. 비록 그림을 많이 쓰지는 않지만 저 역시 전체 문서의 포맷이라던가 폰트 같은 것들에 대해 신경을 쓰는데 이 부분이 이글루스 PDF의 문제인것 같습니다. 아예 Acroabt Professioanl을 하나 구입해서 그 때 그 때 제가 직접 PDF를 만드는 방법을 쓸 까 생각 중 입니다. 이렇게 하면 덧글과 답글도 PDF 문서에 포함시킬 수 있으니 훨씬 더 알찬 내용을 저장할 수 있겠다는 생각을 합니다. 방문 감사합니다. 그리고 자주 놀러 가겠습니다.
warren 2007/01/01 01:49 # 답글
여러가지 변수가 있을 수 있겠죠. 특히 웹이 결부된 경우라면 더더욱 그러하겠구요. '예를 들면' 싸이질을 주로 하던 시기에 거기 모아뒀던 자료들을, 유행이 시들해졌거나 그냥 단순한 변심으로 새롭게 쓰기 시작한 곳으로 이전해야 할 경우 큰 문제가 되죠 .그리고 또 한가지 생각해 볼 수 있는 것은 동시에 여러개의 사이트(블로그, 1인 전용 커뮤니티, 웹하드 등)를 병행해서 이용하는 경우입니다. 점점 자료들이 쌓여가면서 관리하기도 어려워지고 나중에 날잡아서 싸악 정리해야지 하는 마음을 가져도 그건 결국 생각에 그치고 말 확률이 높죠. 그럼에도불구하고 개인컴퓨터 하드 저장공간안에 자료들을 저장해놓는 것은 승률 51퍼센트의 도박을 하는 거나 다름없다는 것을 몇번의 사고를 통해 체득해버린지라, 결국 클리오님과 같은 연유로 이글루스를 선택한 사람입니다. 글 잘 읽었습니다. 반갑습니다. 함부로 글 남겨 죄송합니다.
Clio 2007/01/01 15:50 # 답글
warren 님 / "함부로... 죄송.." 이라니요. 좋은 글을 남겨 주셔서 오히려 제가 감사할 따름입니다. 수많은 변수가 있겠지요. 디지털 자료의 관리는 자료의 생산 만큼이나, 아니 생산보다 더 신경쓰이는 일입니다. 정말 "날잡아서 싸악 정리해야지" 라는 생각은 말 만큼 쉽지 않지요. 자주 오셔서 좋은 말씀 남겨주십시오.
FearFree 2007/01/14 00:30 # 답글
좋은 글 잘 읽었습니다. 인문학도랍시고 대학에 들어오긴 했지만, 턱없이 부족합니다. 자주 오면서 제 생각도 정리해보고 가끔 트랙백도 달아보도록 하겠습니다.^^
Clio 2007/01/14 05:56 # 답글
FearFree 님 / 누군들 완벽하겠습니까? 늘 고민하고 의심하고 생각하고 때로는 '두려움 없이' 앞으로 나아가야겠지요. 산을 하나 넘었다 싶으면 또 다른 산이 나타나고 그 산을 넘으면 또 다른 산이.. 이런 식으로 산을 넘어 가다 보면 어느 사이엔가 성장해 있는 자신을 발견할 수 있지 않을까요? 어쩌면 인생은 끊임없이 산을 넘어가는 것이 아닐까 싶기도 합니다. 자주 좋은 글 남겨 주십시오.
보드라우미 2007/01/19 17:38 # 답글
링크 타고 왔습니다. 좋은 글 써주셔서 감사합니다. 컴퓨터 사용하는 사람치고 자료 한 번 안 날려본 분은 거의 없을 거라고 생각합니다.이글루스를 쓰시는 분들이 그런 이유 때문에 이글루스를 쓰시기도 한다는 걸 처음 알았습니다.
저 같은 경우엔 블로그를 오래 지속할 목적으로 블로그 사이트의 운영방침의 영향을 가능한 한 안 받으려는 목적으로 태터툴즈라는 독립 블로그를 쓰기 시작했는데요, 가끔 서버에 백업하고 하드에도 백업하고 있습니다.
저도 하드가 망가져서 수리센터도 다녀온 경험이 있고 해서 가끔 중요자료를 dvd-R로 굽고 그래야 한다는 걸 알고는 있는데, 그게 참 쉽지는 않더라구요.
세월 지나서 과거에 쓰던 저장매체들을 쓸 수 없게 된 경우들을 보면서(하드웨어의 변화 때문), 말씀하신 대로 종종 주기적으로 업그레이드를 시켜주고 자료변환을 시켜주어야겠다는 실감을 합니다.
그러려면 최소한 자료변환에 대한 기술만이라도 배워서 써먹어야겠다는 생각을 하게 되는데요, 참으로 기술에 얽매인 삶이 될 수 밖에 없구나...... 싶은 느낌이 들어서 약간 서글퍼지기도 합니다.
아뭏든 글 읽고 놀란 점은, '내 손자 손녀가 볼 수 있도록 자료를 보관하자'라는 장기적 안목이었습니다.
현실에서는, 자신이 과거에 만들어놓은 글이나 자료가 인터넷 검색엔진에서 자유자재로 검색되기 때문에, 어떤 사이트나 게시판에서 써놓은 글들을, 그 곳을 탈퇴할 때는 모두 지우는 분들도 있다고 하더라구요.
자신의 신상정보나 자신의 글, 작품들이 검색되고 노출되고 심지어 나쁜 사람들에게 악용당하는 경우들도 보고되고 있는 현실인지라, 인터넷 상의 자료를 어떻게 관리하고 통제할 것인가는 현시대의 중요한 문제라고 생각합니다.
그리고 먼 훗날에는 물론 우리 후손들이 우리가 만들어놓은 자료들 중 보존된 자료들을 역사자료, 연구자료로 활용할 날이 반드시 올 것입니다. 그런 날을 생각한다면 우리가 만드는 자료들의 보관방법을 신중히 생각할 필요는 분명히 있지요.
우리 후손대까지 갈 것도 없이, 과거에 찍어놓은 사진자료라든가 일기, 회상록, 감상문 등도 잘 보관해놓아야만 추후에 필요할 때 찾아보고 활용할 수 있겟지요. 자료 날렸을 때의 그 아픔은 정말...... 당해본 분들은 잘 아실 거예요. ^^;;;
새해 복 많이 받으세요. 건강하세요~
Clio 2007/01/22 06:38 # 답글
보드라우미 님 / 제대로 된 보관과 관리는 비단 인터넷 자료 뿐만 아니라 문서로 만들어지는 각종 자료들에 대해서도 마찬가지인 이야기이지요. 안타까운 것은 우리 조상들의 자료 관리 전통이 한동안 잊혀졌었다는 것입니다. 어떤 정부에서는 자신들의 잘못을 보여주고 있는 기록들을 조직적으로 파기했다고 하는 이야기도 들었는데 사실이 아니길 빌뿐입니다. 다른 글에서 말씀해 주셨던 것 처럼 이러한 자료들은 우리의 기억을 보완해주는 정말 소중한 역할을 하고 있지요. 늦었지만 새해 복 많이 받으십시오.