IT상식

개방형 문서 표준 (ODF) 이해하기

지윤나라 2023. 6. 20. 22:09
728x90

[ ODF 란? ]

* ODF(Open Document Format for Office Applictions)
* ODF는 XML 형식의 텍스트 파일과 화상 등 바이너리 파일을 zip으로 압축한 것을 말한다.
* 2006년 국제표준화기구(ISO0 및 국제전기표준회의(IEC) 인증을 받아 "ISO/IEC 26300:2006" 이라는 국제 표준이 되었다. 
* ODF는 소프트웨어의 종류나 버전, 컴퓨터 기종에 상관없이 모든 데이터나 문서가 상호 호환이 가능하고 같은 방식으로 편집 및 인쇄를 할 수 있다. 
* 이를테면 아래아한글과 MS워드가 ODF를 채택하면 데이터의 손상 없이 교환이 가능해진다. 
* 오픈오피스, 리브레오피스, MS오피스, 구글독스에서 ODF를 읽고 쓸 수 있으며, 국내에서는 한컴오피스, 폴라리스오피스 등에서 ODF를 지원한다.
* 정부나 공공기관이 특정 IT업체의 프로그램에 종속되는 일을 피하기 위해 영국이나 독일, 프랑스, 일본, 미국의 일부 주에서는 정부 문서에 ODF를 의무적으로 채택하고 있다.
* 한국에서도 ODF가 2007년 국내 산업 표준(KS X ISO/IEC 26300)으로 채택되었으며, 같은 해 정보통신부에서 '행정업무용 문서표준'으로 채택하기도 했다.
* 그러나 이와 관련된 법률적인 규제는 없어 여전히 공공문서가 아래아한글(hwp) 포맷으로 만들어지고 있는 현황이다. 
* 이 경우 아래아한글 사용자만 공문서를 읽을 수 있다는 문제가 제기되어 왔다. 또 데이터 경제가 발달하면서 폐쇄적인 hwp 문서를 기계가 읽을 수 없어 수많은 데이터를 활용할 수 없다는 문제점도 발생하고 있다. 
* hwp 데이터를 활용하기 위해서는 OCR(광학문자인식) 기술로 내용을 판독한 뒤 판독한 데이터를 다시 저장해야 하므로 비효율적이기 때문이다.

 

[ ODF 구성 ]

* ODF는 하나의 XML 문서로도 표현이 가능하지만, 일반적으로 여러개의 XML 문서와 그림과 같은 이진 파일을 하나의 zip 컨테이너 안에 묶는 형태이다. ODF 파일의 구성은 다음과 같다.

< mimetype >

   - 문서의 MIME 타입을 기술한다.

< meta.xml >

   - 문서의 메타데이터를 포함한다.

< content.xml >

   - 문서의 실제 내용을 담고 있는 파일이다.

< styles.xml >

   - 문서에 사용되는 스타일을 담고 있는 파일이다.

< Pictures (폴더) >

   - 문서에서 사용하는 그림 파일을 담고 있는 폴더이다. 문서에서 그림을 참조할 때는 XLink 표준을 사용한다.

 

[ PDF/A ]

* PDF/A 는 전자 문서 의 보관 및 장기 보존 에 사용하도록 전문화된 PDF( Portable Document Format )의 ISO 표준 버전입니다. 
* PDF/A는 글꼴 연결( 글꼴 포함 과 반대 ) 및 암호화와 같은 장기 보관에 적합하지 않은 기능을 금지한다는 점에서 PDF와 다릅니다. 
* PDF/A 파일 뷰어에 대한 ISO 요구 사항 에는 색상 관리 지침, 포함된 글꼴 지원 및 포함된 주석 을 읽기 위한 사용자 인터페이스가 포함됩니다.
* PDF/A-1 : PDF 1.4 사용
* PDF/A-2 : ISO 32000-1의 사용
* PDF/A-3 : 포함된 파일을 지원하는 ISO 32000-1 사용
* PDF/A-4 : ISO 32000-2의 사용

 

[ Office Open XML (OOXML) ]

* MS사가 표준화를 추진해 Ecma-376 국제 표준으로 만들었고, 그 이후 ISO/IEC 29500 표준으로 등재되었다.
* ODF와 비슷하게 XML 기반에다 압축파일의 형태를 가진다는 공통점이 있다.
* ODF와 OOXML 모두 국제 표준이다.

 

[ 개방형 워드프로세서 마크업 언어 (OWPML) ]

* OWPML(Open Word-Processor Markup Language)는 2011년 12월 30일 제정된 한국산업표준(KS X 6101)으로 HWPML의 국가표준 버전으로 국내문서 표준화 위원회를 통해 진행되었다.

 

[ HWPX ]

* HWP의 기능을 XML 형태로 표현한 개방형 문서 포맷
* hwpx는 한글 문서의 콘텐츠를 표현할 수 있는 개방형 워드프로세서 마크업 언어(OWPML)로 개발된 파일 형식입니다.
* HWP는 바이너리 형태의 문서 포맷임으로 별도의 애플리케이션이 있어야 데이터 추출이 가능하지만, HWPX는 XML구조를 분석하여 데이터를 추출함으로 여러 시스템에서 재가공, 재수정(Machine Readable) 가능하다. 
* ODT에 비해서 객체별 분류 구조가 좀 더 구체적이고, HWP와 기능이 동일하여 편리하고, 메타 테크도 조만간 지원 예정이다.
* 메타태그는 이미지 내부 폰트에 어떤 글자로 인식해야 하는지 태킹을 함으로써 텍스트 인식, 음성안내, 시각장애우 안내 등에 활용 가능하다.
* 문서 내 객체 인식하여 문서 미리 보기, 검색 시 빠르게 데이터 검색 가능
* 한국전자문서산업협회와 함께 국제표준화기구(ISO)에 hwpx를 국제표준으로 지정하기 위한 협력도 추진한다

 

[ ISO/IEC 26300 (ODF 국제표준) ]

* OASIS 표준
* Office 응용 프로그램용 개방형 문서 형식(OpenDocument)
* ISO/IEC 26300:2006 - 
* ISO/IEC 26300:2015 - v1.2
* ISO/IEC 26300:2021 - OpenDocument 버전 1.3 (2021,04,27)

 

[ ISO/IEC 29500 (OOXML 국제표준) ]

* OXXML(Office Open XML, OOXML, 오픈 XML)은 XML을 기반으로 한 파일 포맷이다
* 마이크로소프트가 추진하였으며 2006년과 2008년 두 차례에 걸쳐 Ecma 인터내셔널에 유럽 표준(ECMA-376)으로, 2008년에 ISO/IEC에 국제 표준(ISO/IEC 29500:2008)으로 승인되었다. 
* 이 문서 규격은 문서, 프레젠테이션, 스프레드시트를 포함한다. 확장자는. docx 또는 .docx(문서), .pptx(프레젠테이션), .xlsx(스프레드시트)로 통일되어 있다.

 

[ Hibrid PDF ]

* 리브레오피스에서 지원하는 포맷으로 PDF안에 ODF 문서를 임베디드 시킨 것이다.
* 열람할 때는 PDF를 쓰고 편집이 필요할 경우에는 그 안에 포함된 ODF를 사용할 수 있어서 한 파일로 두 가지 용도를 충족시킨다.

 

[ 온톨리지 (Ontology) ]

* 존재하는 사물과 사물 간의 관계 및 여러 개념을 컴퓨터가 처리할 수 있는 형태로 표현하는 것
* 어떤 일정 범위에서 사용되는 단어들의 개념, 특성, 연관 관계 등을 표현하여 단어에 대한 일반적 지식이 명시적으로 드러나고, 단어 간 관계 정의를 통해 문장의 의미를 파악할 수 있다.
* 온톨로지는 인공 지능(AI), 시맨틱 웹(semantic web), 자연어 처리(NLP: Natural Language Processing), 문헌정보학 등 여러 분야에서 지식 처리, 공유, 재사용 등에 활용된다
* 온톨로지는 클래스(class, 또는 개념[concept]), 인스턴스(instance, 또는 indivisual), 속성(property), 관계(relation) 등의 구성 요소로 표현된다.
* 클래스는 사물의 개념(concept), 즉 범주(category)를, 인스턴스는 개별 요소인 실체(entity)를 뜻한다. 
* 속성은 클래스와 인스턴스의 특성(feature)을 나타내며, 관계는 클래스 및 인스턴스 간의 관계성을 표현한다. 
* 예를 들어, ‘평창’ 인스턴스는 ‘2018년 동계 올림픽 개최’라는 속성으로 ‘올림픽’ 클래스와 관계를 맺는다. 따라서 ‘올림픽’을 검색하면 ‘평창’이 연관 검색어로 나온다.
* 소프트웨어 응용 프로그램, 비즈니스 거래에서 용어나 클래스 등에 대한 의미 해석이 달라 발생할 수 있는 상호 운영성 문제를 예방할 수 있다.
* 온톨로지 작성에 사용되는 대표적인 언어로, 웹상의 정보 처리에 사용되는 웹 온톨로지 언어(OWL: Web Ontology Language)와 형태 제약 언어(SHACL: Shapes Constraint Language), 비즈니스 정보 거래에 사용되는 확장성 비즈니스 보고 언어(XBRL: eXtensible Business Reporting Language), 지식 기반 시스템(knowledge-based system)에서 정보를 공유하고 재사용하는 데 쓰이는 지식 교환 형식(KIF: Knowledge Interchange Format) 언어와 술어 논리 기반의 공통 논리(CL: Common Logic, ISO/IEC 24707) 언어 등이 있다.

 

[ 한컴웍스 ]

* 아마존과 합작하여 판매되는 제품이다.

* 화상채팅, 이메일발송, 문서작성, 엑셀작업 등 MS제품과 경쟁이 가능한 소프트웨어다.

* 한컴웍스를 사용하려면 클라우드 상에서 서비스로 이용하고 돈을 지급하는 서비스형 소프트웨어(SaaS: Software as a Service)이다.

 

[ 두레이 ]

* NHN의 클라우드 서비스형 소프트웨어(SaaS) 협업설루션이다.

* 메신저, 화상회의, 메일, 인사, 전자결재 등 기업이 필요한 모든 서비스를 제공한다.

* 클라우드형 오피스로는 Polaris Office가 제공되고 있고, 한컴오피스도 제공될 예정이다.