메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

이정용 (서경대학교, 서경대학교 대학원)

지도교수
이광엽
발행연도
2014
저작권
서경대학교 논문은 저작권에 의해 보호받습니다.

이용수5

표지
AI에게 요청하기
추천
검색

초록· 키워드

오류제보하기
CPU의 코어가 멀티코어화 되면서 많은 애플리케이션이 병렬성을 나타내고 있다. 하지만 CPU는 직렬 처리에 최적화된 몇 개의 코어로 구성되어 있어 병렬처리를 하는 것에 한계가 있다. 최근에는 CPU를 이용한 병렬처리의 한계로 GPU를 이용해 병렬처리를 하고 있다. 그래픽 처리 장치인 GPU(Graphic Processing Unit)는 더 이상 그래픽 데이터 처리에만 사용되지 않고 범용적인 분야까지 사용이 확대되고 있다.
본 논문에서는 모바일 환경에서의 병렬처리를 위한 SIMT(Single Instruction Multiple Threads) 구조의 멀티코어 GP-GPU를 구현하였다. 구현한 GPU는 슈퍼스칼라 구조로 최대 4개의 명령어를 동시에 처리 할 수 있게 하여 성능을 높였다. 모바일용 CPU의 코어 수보다 많으면서 최대한 자원 사용량을 줄이고 설계 면적 대비 성능을 높이고자 SP(Stream Processor)는 16개로 구성하였다. SP는 합성 시 2의 제곱수로 SP의 수를 최대 64개까지 조정할 수 있게 설계하였다. 각 SP는 사용면적과 전력소모를 줄이기 위해 SP당 3개의 ALU를 탑재하고 있다. 슈퍼스칼라 구조의 단점인 레지스터 뱅크 충돌을 줄이고 사용자원 대비 성능을 높일 수 있는 구조인 4단 OC(Operand Collector)를 설계하였다. 모바일 환경의 CPU를 탑재하고 있는 Odroid-X, Odroid-XU, Odroid-X2, RaspberryPi 플랫폼과 구현한 GPU를 640x480 크기의 307200개의 픽셀을 갖는 이미지를 이용해 영상처리 알고리즘을 병렬처리하여 수행 속도를 비교하였다. 수행 속도를 비교한 결과 설계한 GPU를 이용해 병렬처리 하는 것이 최신 모바일 환경의 CPU인 ARM Cortex-A15 4Core를 이용한 것 보다 적분영상 생성은 17%, 3x3 가우시안 필터는 7%, 5x5 가우시안 필터는 4% 성능 향상이 있었다.

목차

목차
I. 서론 1
II. 연구배경 5
1. GPU의 발전 과정 5
2. 래스터화 가속을 위한 GPU 6
3. 지오메트리 연산 가속을 지원하는 GPU 7
4. 프로그래밍이 가능한 셰이더를 지원하는 GPU 8
5. 통합 셰이더를 지원하는 GPU 9
6. General Purpose Computing on GPU 11
7. OpenCL 13
III. 기존 모바일 GPU 연구 15
1. ARM Mali-400 MP 15
2. Qualcomm Adreno 18
3. ARM Mali-T604 19
IV. SIMT 구조의 모바일 GP-GPU 설계 21
1. GP-GPU High Level Architecture 22
2. GPU Instruction Set 24
3. Instruction Fetch Unit 28
4. Instruction Pre-Decoder 31
5. Operand Collector 32
6. Operand Collector to ALU Crossbar 39
7. Latency Hiding 41
8. Arithmetic and Logic Unit 42
V. 연구결과 실험 및 분석 45
1. 실험 및 검증환경 45
2. MPW 결과 47
3. 성능 비교 48
VI. 결 론 53
참고문헌 54

최근 본 자료

전체보기

댓글(0)

0