PDF와 HTML의 비교에 대해 궁금해 하시는 분들을 꽤 자주 봅니다.

기술적으로 보면 PDF와 HTML은 비교 대상이 될만한 유사성이 별로 없습니다만, 컨텐트의 컨테이너라는 점에서 그리고 플랫폼 독립적이라는 점 등에서 서로가 비교 대상이 될 수도 있습니다.

PDF 문서는 대부분 인쇄를 염두에 두거나, 원본 문서를 있는 그대로 전달하기 위한 용도로 사용되어 왔습니다.

그렇다면 인터넷, 특히 웹 환경에서의 문서 포맷으로 PDF 문서는 어떤 장점과 단점을 가지고 있을까요? 이러한 의문을 현재 웹환경의 표준 문서 기술 언어인 HTML과의 비교를 통해 풀어보겠습니다.


일단 간단히 둘을 비교한다면,


    PDF는 장치나 운영체제에 관계없이 어떠한 환경에서도 똑같은 모습으로 보여지고 출력될 수 있습니다.


    HTML은 화면상의 보기와 사용자와의 인터페이스를 위하여 설계되었습니다. 화면상에서 읽기에 최적화 되어 있지만, 브라우저에 따라서 보이는 모습이 달라질 수 있고 또한 출력이 상대적으로 어렵습니다.

이제 좀더 자세히 알아 보겠습니다.


1. 비용

    PDF: 매우 저렴한 비용에 제작될 수 있습니다. 원고를 일반적으로 사용하는 워드프로세서 또는 오피스류 소프트웨어를 사용할 수 있기 때문입니다.

    HTML: 사용자 인터페이스와 상호작용, 화면 보기에 신경을 쓰는 만큼 비용이 증가합니다. 하이퍼링크, 썸네일, 이미지 등은 꽤 지식과 시간을 요합니다.


2. 파일 구조

    PDF: 모든 요소가 단일 파일 내부에 저장되며, 대체로 워드 등과 같은 파일 보다 크기가 작습니다.

    HTML: 텍스트와 이미지, 멀티미디어 요소가 분리된 파일로 존재 합니다. 대체로 하나의  페이지는 10-20여개의 파일로 이루어 집니다.


3. 화면 보기

    PDF: 원고와 완전히 동일한 모습을 보여주며, 3200% 까지의 확대가 가능합니다.

    HTML: 보여지는 모습은 브라우저, 화면 해상도, 브라우저 세팅 등과 같은 요소에 의해 달라질 수 있습니다.


4. 인터랙티브 요소

    PDF: 가능하기는 하나 꽤 어렵고 시간이 걸리는 작업이 됩니다.

    HTML: 이미지 뿐만 아니라, 오디오, 비디오 클립, 폼에 이르기 까지 다양한 요소를 그리 어렵지 않게 사용할 수 있습니다.


5. 출력 품질

    PDF: 원본과 완전히 동일합니다.

    HTML: 화면 보기의 경우와 비슷하게 많은 요소에 의해 달라 질 수 있으며, 대체로 화면이 잘리거나, 마진이 틀려지는 등의 트러블이 종종 발생합니다.


6. 수식 사용

    PDF: 원본에서 표현된 것과 완전히 동일하게 표현합니다.

    HTML: 수식을 직접적으로 지원하지 않습니다. 따라서 별도의 이미지 파일로 수식을 표현해야 하는 등의 번거로움이 있습니다.


지금 까지의 사실을 바탕으로 두 포맷 간의 장단점을 비교해 보겠습니다.


[장점]

    PDF: 쉽게 만들 수 있고, 원본과 동일한 화면/출력 품질을 유지합니다.

    HTML: 인터랙티브 요소를 쉽게 만들 수 있고, 오디오/비디오 클립 등과 같은 데이터를 쉽게 포함할 수 있습니다. (최신 PDF 스펙은 HTML 만큼은 아니지만 멀티미디어 요소를 포함할 수 있습니다.)


[단점]

    PDF: 인터랙티브 요소의 추가가 쉽지 않습니다.

    HTML: 단일 페이지를 구성하는 파일의 개수가 많아 제작과 관리가 힘들며,  여러 플랫폼에서 일관적인 모양을 유지하기가 힘들고 출력이 어렵습니다.

TAG HTML, PDF, 비교

트랙백 주소 :: http://www.epapyrus.com/blog/jeong/trackback/30

댓글을 달아 주세요

PDF 문서는 대부분 인쇄를 염두에 두거나, 원본 문서를 있는 그대로 전달하기 위한 용도로 사용되어 왔습니다.


그렇다면 인터넷, 특히 웹 환경에서의 문서 포맷으로 PDF 문서는 어떤 장점과 단점을 가지고 있을까요? 이러한 의문을 현재 웹환경의 표준 문서 기술 언어인 HTML과의 비교를 통해 풀어보겠습니다.


일단 간단히 둘을 비교한다면,


    PDF는 장치나 운영체제에 관계없이 어떠한 환경에서도 똑같은 모습으로 보여지고

    출력될 수 있습니다.


    HTML은 화면상의 보기와 사용자와의 인터페이스를 위하여 설계되었습니다.

    화면상에서 읽기에 최적화 되어 있지만, 브라우저에 따라서 보이는 모습이 달라질 수 있고

    또한 출력이 상대적으로 어렵습니다.


이제 좀더 자세히 알아 보겠습니다.


1. 비용

    PDF: 매우 저렴한 비용에 제작될 수 있습니다. 원고를 일반적으로 사용하는 워드프로세서,

    또는 오피스류 소프트웨어를 사용할 수 있기 때문입니다.

    HTML: 사용자 인터페이스와 상호작용, 화면 보기에 신경을 쓰는 만큼 비용이 증가합니다.

    하이퍼링크, 썸네일, 이미지 등은 꽤 지식과 시간을 요합니다.


2. 파일 구조

    PDF: 모든 요소가 단일 파일 내부에 저장되며, 대체로 워드 등과 같은 파일 보다 크기가

    작습니다.

    HTML: 텍스트와 이미지, 멀티미디어 요소가 분리된 파일로 존재 합니다. 대체로 하나의

    페이지는 10-20여개의 파일로 이루어 집니다.


3. 화면 보기

    PDF: 원고와 완전히 동일한 모습을 보여주며, 3200% 까지의 확대가 가능합니다.

    HTML: 보여지는 모습은 브라우저, 화면 해상도, 브라우저 세팅 등과 같은 요소에 의해

    달라질 수 있습니다.


4. 인터랙티브 요소

    PDF: 가능하기는 하나 꽤 어렵고 시간이 걸리는 작업이 됩니다.

    HTML: 이미지 뿐만 아니라, 오디오, 비디오 클립, 폼에 이르기 까지 다양한 요소를

    그리 어렵지 않게 사용할 수 있습니다.


5. 출력 품질

    PDF: 원본과 완전히 동일합니다.

    HTML: 화면 보기의 경우와 비슷하게 많은 요소에 의해 달라 질 수 있으며, 대체로

    화면이 잘리거나, 마진이 틀려지는 등의 트러블이 종종 발생합니다.


6. 수식 사용

    PDF: 원본에서 표현된 것과 완전히 동일하게 표현합니다.

    HTML: 수식을 직접적으로 지원하지 않습니다. 따라서 별도의 이미지 파일로 수식을

    표현해야 하는 등의 번거로움이 있습니다.


지금 까지의 사실을 바탕으로 두 포맷 간의 장단점을 비교해 보겠습니다.


[장점]

    PDF: 쉽게 만들 수 있고, 원본과 동일한 화면/출력 품질을 유지합니다.

    HTML: 인터랙티브 요소를 쉽게 만들 수 있고, 오디오/비디오 클립 등과 같은 데이터를

    쉽게 포함할 수 있습니다.


[단점]

    PDF: 인터랙티브 요소의 추가가 쉽지 않습니다.

    HTML: 단일 페이지를 구성하는 파일의 개수가 많아 제작과 관리가 힘들며,

    여러 플랫폼에서 일관적인 모양을 유지하기가 힘들고 출력이 어렵습니다.

TAG HTML, PDF

트랙백 주소 :: http://www.epapyrus.com/blog/jeong/trackback/5

댓글을 달아 주세요

네이버 지식인에 올라온 질문이나, 회사에 오는 문의 전화를 보면

PDF 문서에 걸린 암호를 해제 할 수있냐 라는 질문이 제법 있습니다.


결론 부터 말씀 드리면 PDF를 만들기에 달렸다라고 할 수 있습니다.


[어떻게 하면 암호를 깰 수 있나?]

인터넷을 돌아다니다 보면, 암호를 깨 주는 소프트웨어들 또는 그런 서비스를 하는 회사들이 있습니다.

이들의 원리는 간단합니다. 암호가 풀릴때 까지 입력해 보는 것입니다. :-)

거짓말이 아닙니다. 컴퓨터를 이용해 가능한 모든 조합의 암호를 직접 입력해 보는 것이지요.

맨처음 한자리로 된 암호를 만들어서 모두 입력해보고, 그 다음은 두자리, 세자리 식으로 해서 암호 조합을 만들고 입력해서 풀리는 지를 확인하는 것이지요.


사실 이러한 방법에 버틸 수 있는 암호 알고리즘은 절대 존재 하지 않습니다.


[간단한 산수]


그런데 웹사이트에 사용자 등록 등을 하다 보면, 8자리 이상의 암호를 쓰라는 이야기를 보신적이 있을 것입니다. 바로 이 "될 때 까지 입력하기"는 암호 자리수가 늘어나면 경우의 수가 기하 급수적으로 늘어나 불가능해 지기 때문입니다.


만일 8자리라면 128^8 = 7.2057E16  (0이 16개라는 뜻입니다.) 즉 최악의 경우 72,057경 번 만큼 시도를 해야 하기 때문에, 4GHz 컴퓨터가 1초에 4조 개의 명령어를 처리한다고 가정하더라도 (실제로는 이 보다 훨씬 적습니다.) 1억 8천초 즉 5년 8개월 정도의 시간이 소요됩니다.


만약 9자리라면 5년 8개월의 128배 즉, 729년 정도가 걸리는 것이지요.


그런데, 128이라는 숫자는 알파벳, 숫자 그리고 기호를 포함한 문자의 개수 입니다. 만일 알파벳 소문자로만 암호가 이루어 졌다고 가정하면, 26^8 = 2.08E11 즉 0.05초 만에 암호를 알아 낼 수있게 됩니다.


[안전한 PDF 문서 만들기]

자 이제는 안전한 PDF 문서를 만드는 법을 알려 드리겠습니다.

민감한 문서의 경우에는 숫자, 문자, 기호를 포함하여 8자리 이상으로 구성된 암호를 사용하여야 합니다. 이 원칙은 어떠한 암호에도 적용됩니다. 모든 암호는 "될 때 까지 입력하기"로 깨질 수 있기 때문입니다.

트랙백 주소 :: http://www.epapyrus.com/blog/jeong/trackback/4

댓글을 달아 주세요

  1. 나그네 2007/07/16 17:15  댓글주소  수정/삭제  댓글쓰기

    음..좋네요. '될때까지 입력하기' 저는 한번 해볼랍니다^^

  2. 모던보이 2007/07/16 18:11  댓글주소  수정/삭제  댓글쓰기

    좋은 컴퓨터로 해 보시길 ㅎㅎ

가끔 웹서핑을 하다 보면, 다음에도 꼭 찾아 보고 싶은 웹사이트 또는 글들이 있습니다.

보통 우리는 이런 경우, Ctrl-D 키를 눌러서 북마크를 해 둡니다.


그런데 혹시 이런 경험들은 없으세요? 오늘은 시간이 없어서 다 읽어 보지는 못하고 북마크만 해 두었는데, 다음에 방문 했더니 링크가 깨져 있거나 내용이 사라져 버린 경우 말입니다.


이 경우 외에도, 웹사이트 상의 정보는 내 컴퓨터 상이 아니라 해당 서버 컴퓨터 상에 있는 내용이므로 언제 어떤 일이 벌어질지 알 수 없습니다.


보통 이런 문제를 해결 하기 위해서 종이 문서로 출력해서 보관하는 방법도 있습니다. 하지만 역시 이렇게 출력된 문서들은 책상위에서 며칠을 보내다가 사라지거나, 서랍 속에서 잠을 자게되는 경우가 대부분이지요.


이럴때는 PDF가 좋은 해결책이 됩니다.


꼭 보관하고 싶은 내용을 봤다면, 이 페이지를 PDF 로 만들면 됩니다. 그러면 더 이상 해당 웹사이트와 관계 없이 내용을 내 컴퓨터에 보관할 수 있습니다.

또한 오프라인에서도 문서를 읽을 수 있기 때문에, 출퇴근 지하철이나 버스 안에서도 노트북이나 PDF를 통해 문서를 볼 수 있지요.


전자 상거래나 전자 티켓 등에도 활용이 가능 합니다. 인터넷에서 물품을 구입하면 나오는 전자 영수증도 PDF로 만들어서 보관할 수있습니다. 또한 전자 티켓도 당장 프린트 하지 않고 PDF로 만들어 놓으면 여러모로 편리합니다.


그렇다면 웹사이트를 PDF로 만드는 법을 알아 봅시다.

PDF-Pro 3.0은 은 45일간 모든 기능을 무료로 사용해 볼수 있는 소프트웨어 입니다. http://www.pdfpro.co.kr에서 쉽게 다운로드 받아 설치 할 수 있습니다.

설치가 완료되면 프린터에 PDF-Pro 라는 이름이 생길 것입니다. 이것이 바로 가상 프린터로 실제 프린터로 출력하는 것과 같이 이 프린터에 출력을 보내면, 그 내용을 PDF로 만들어 주는 것입니다.


이 외에도 웹사이트를 PDF로 변환했을때 얻을 수 있는 이점에 대해서 같이 이야기 해 보면 좋겠네요.

TAG PDF, PDF2HTML

트랙백 주소 :: http://www.epapyrus.com/blog/jeong/trackback/3

댓글을 달아 주세요

Adobe PDF? Everybody's PDF!

PDF 2007/07/14 01:35

많은 사람들이 PDF는 아도비社의 것이 아니냐는 말을 한다.


특히 여타 다른 PDF 관련 소프트웨어들이 Adobe의 특허 기술을 침해하는 것이 아니냐, 또는 저작권을 침해하는 것이 아니냐 등의 우려를 하는 것이다.


1. 상표권

PDF를 지칭하는 표현은 여러가지로 사용되고 있다.

흔히 아크로뱃 파일, Adobe PDF, 아크로뱃 PDF 등으로 불려진다.

그런데, 가장 정확한 표현은 그냥 "PDF"라고 부르는 것이 맞다.


PDF는 "Portable Document Format"의 약자이다. 그리고 PostScript (R)와는 다르게 등록 상표가 아니다. 즉, PDF는 단순한 약자로서 누구도 상표에 대한 소유권을 가지고 있지 못하며, 누구나 PDF라는 단어를 사용할 수 있다.


2. 특허

특허법에 따르면, 특허법으로 보호 되는 것은 발명으로 발명은 "자연법칙을 이용한 기술적 사상의 창작으로 고도한 것"이라 정의 되어 있다. 그러므로 전자 문서의 형식을 규정하고 있는 PDF 포맷은 특허 보호의 대상이 아니라, 저작권 보호의 대상이다.

즉 PDF 포맷의 이용과 특허와는 관계가 없다.


3. 저작권

미국 Adobe Systems Incorporated사 는 Portable Document Format (PDF)라 불리는 데이터 포맷에 대하여 저작권을 보유하고 있다. 아도비사는 PDF를 전자 문서의 표준으로 만들기 위하여, 아래의 경우에 대하여 누구에게나 사용권을 허가 하고 있다.

- 표준을 준수하는 PDF 파일의 생성
- 표준 PDF를 생성하는 소프트웨어의 개발
- PDF 파일의 내용을 화면에 표시, 출력 또는 해석 하는 소프트웨어의 개발


즉, 위에서 이야기 한 바와 같이 PDF는 "공개된" 스펙으로 스펙을 준수한다면 누구나 PDF 포맷을 사용하는 제품을 개발하고 배포할 수 있는 것이다.

TAG PDF

트랙백 주소 :: http://www.epapyrus.com/blog/jeong/trackback/1

댓글을 달아 주세요