메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술저널
저자정보
홍상균 (한림대학교) 윤지희 (한림대학교)
저널정보
Korean Institute of Information Scientists and Engineers 정보과학회논문지 : 데이타베이스 정보과학회논문지 : 데이타베이스 제39권 제1호
발행연도
2012.2
수록면
17 - 29 (13page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
최근 차세대 시퀀싱 기술의 발달에 따라 인간 유전체 시퀀싱을 위한 비용이 현저히 낮아지고 있으며, 이에 따라 전 세계적으로 생성되는 대규모 차세대 시퀀싱 데이터가 매우 빠른 속도로 축적되고 있다. 그러나 이와 같은 대규모 유전체 데이터를 실시간에 효율적으로 처리, 분석할 수 있는 소프트웨어 개발에 관한 연구는 아직 매우 미흡한 상황이다. 본 연구에서는 클라우드 컴퓨팅 기반의 단위 반복 변이(Copy Number Variation, CNV) 추출 알고리즘, CloudCNV를 제안한다. 제안하는 알고리즘은 차세대 시퀀싱 데이터를 표준 서열(reference sequence)에 매핑(mapping)하여 얻어지는 커버리지(coverage) 데이터의 모양 변화를 기반으로 단위 반복 변이 영역을 추출한다. CloudCNV에서는 대표적인 클라우드 컴퓨팅 플랫폼인 하둡(Hadoop)과 맵리듀스(MapReduce) 기법을 이용하고, 클라우드 컴퓨팅 환경에서 데이터의 분산 처리 및 노드간의 로드 밸런싱을 위해 데이터의 확장 파티셔닝 기법을 사용한다. 성능 평가를 위하여 “1000 게놈 프로젝트”에서 제공하는 공용의 시퀀싱 데이터를 이용한 로컬 및 상용 클라우드 컴퓨팅 환경에서의 실험을 수행하였으며, 그 결과 제안하는 알고리즘이 클라우드 환경에서 대규모 데이터로부터 다양한 크기와 모양의 단위 반복 변이 영역을 효율적으로 추출하고 있음을 보인다.

목차

요약
Abstract
1. 서론
2. 관련 연구
3. 클라우드 스케일의 CNV 추출
4. 실험 결과 및 분석
5. 결론 및 향후 연구
참고문헌

참고문헌 (28)

참고문헌 신청

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0

UCI(KEPA) : I410-ECN-0101-2013-569-001480843