유블로그

[Java] XML 본문

Java

[Java] XML

yujeong kang 2020. 8. 13. 12:46

Markup Languange

  • 태그 등을 이용하여 문서나 데이터 구조 표현
  • ex) SGML, HTML
  • 구조가 복잡한 SGML 기반인 HTML은 데이터 표현에 집중
  • HTML은 Web 환경에서 데이터의 표현 확장이 어려움.
  • 그래서 XML(eXtensible Markup Language) 탄생

XML

  • 미리 정의된 tag 없음.
  • tag를 직접 정의하여 사용할 수 있다.
  • 약속된 tag 및 구조를 미리 정의한 후 그에 맞네 XML 문서 만든다.
  • ebXML(전자상거래), MathML(수학공식 표현), SVG(이미지 표현) 등 XML 기반 확장된 Markup 언어가 있다.

 

XML 구조 & 문법

아래 내용들을 지키면 well-formed 문서라고 한다.

문서시작 <?xml version="1.0" encoding="UTF-8"?>
Root element & Tree 구조 <Favorite>
    <Sports sort="field">
       <Football></Football>
    </Sports>
</Favorite>
시작 및 종료 tag 시작 종료 tag 가 반드시 존재하고 일치
대소문자 구별
attribute "" & "
주석 <!-- -->
white space 보존

 

wel-formed 말고도 valid 문서가 되어야 하는데 이를 위해선 각 tag 및 해당 tag의 유효값을 별도의 문서로 구성한 후 명시적으로 지정해 줘야 한다.

이 파일을 DTD(Document Type Definition) 이라고 한다.

XML 문서에 이 문서가 기초하는 DTD 를 명시하고 문서의 모든 요소가 DTD를 만족하면 문서가 Valid 하다고 한다.

즉, DTD 문서를 통해 XML 문서의 Valid를 체크할 수 있다는 것이다.

 

 

XML Parser

XML에 사용된 tag를 구별하고 그 안의 값들을 읽기 위해서 XML Parser라는 Library를 사용한다.

javax.xml package와 org.w3c.package를 주로 사용한다.

 

하나의 문서를 한 번 쭉 읽으면서 tag의 발생별로 처리하는 방법인 SAX가 있고,

문서를 다 읽고난 후 문서 구조 전체를 자료구조에 저장하여 탐색하면서 처리하는 방법인 DOM이 있다.

 

SAX는 빠르지만 한 번에 처리하기 때문에 다양한 탐색을 할 수 없고

DOM은 다양한 탐색이 가능하지만 느리고 무겁다.

 

DOM은 Depth가 깊고 한 번에 처리하기 힘들고(복잡도 클 때) 내용이 적을 때 사용.

SAX는 내용이 많고 복잡도가 적을 때 사용.

 

 

'Java' 카테고리의 다른 글

[Java] Concurrent vs Parallel  (0) 2020.08.18
[Java] Lambda  (0) 2020.08.13
[Java] Java IO  (0) 2020.08.13
[Java] 내부 클래스  (0) 2020.08.12
[Java] final  (0) 2020.08.12