메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술저널
저자정보
저널정보
한국멀티미디어학회 멀티미디어학회논문지 멀티미디어학회논문지 제9권 제9호
발행연도
2006.9
수록면
1,231 - 1,246 (16page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
시각적 렌더링 포맷인 HTML은 연관된 정보를 간결하게 표현하기 위하여 테이블을 사용한다. 그러나 HTML은 컴퓨터로 하여금 정보를 처리 및 가공하게 한다는 측면에서 한계를 갖기 때문에 논리적 구조정보의 표현이 가능한 XML 문서로의 변환이 필요하다. 본 논문에서는 웹으로부터 정보를 추출하기 위한 목적의 일환으로 HTML 테이블의 논리적인 구조를 추출하여 XML 문서로 변환하는 효율적인 방법을 제안한다. 제안된 방법은 영역구분과 구조분석의 두 단계로 구성된다. 영역구분 단계에서는 잡음영역을 제거하며 시각적 및 의미적 일관성 검사를 통하여 테이블에 존재하는 속성과 값 영역을 구분한다. 이후 구조분석 단계에서는 구분된 영역에 제안된 테이블 모델을 적용하여 계층구조를 추출하며, 이로부터 XML 문서를 생성한다. 제안된 영역구분 방법의 성능을 평가하기 위하여 1,180개의 테이블을 대상으로 실험한 결과, 평균적으로 86.7%의 정확도를 보여 기존 연구보다 우수하였다.

목차

요약
ABSTRACT
1. 서론
2. 관련 연구
3. 제안된 방법
4. 실험 결과
5. 결론 및 향후 연구방향
참고문헌

참고문헌 (0)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0

UCI(KEPA) : I410-ECN-0101-2012-004-004442974