메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

우동희 (상명대학교, 상명대학교 일반대학원)

지도교수
김윤호
발행연도
2017
저작권
상명대학교 논문은 저작권에 의해 보호받습니다.

이용수0

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
현재 프로그램이 운용되는 시스템은 기존의 싱글코어 및 멀티코어 환경을 넘어서 매니코어, 부가 프로세스 및 이기종 환경까지 그 영역이 확장되고 있는 중이다. 즉, 계산의 도메인이 CPU를 넘어 GPU 까지 확장되고 있는 중이다. 하지만, 기존 연구의 경우 NVIDIA 벤더에서 나온 아키텍쳐 및 CUDA 로의 병렬화가 주로 이루어졌고 AMD에서 나온 범용 GPU 아키텍쳐인 GCN 아키텍쳐에 대한 최적화 연구는 제한적으로 이루어졌다. 이런 점을 고려해 본 논문에서는 GCN 아키텍쳐의 GPGPU 환경인 OpenCL 내에서의 최적화에 대해 연구하고 실질적인 성능향상을 보이고자 한다. 이를 위해 GCN 아키텍쳐의 메모리 구조 및 작업 환경 등의 특징을 분석하고 이에 적합한 최적화 지점을 도출, 세 지점에 최적화를 진행한다. 최적화 프로그램은 행렬 곱셈과 컨볼루션을 사용해 진행하였다. 행렬 곱셈과 컨볼루션 각 프로그램의 메모리 및 활동 작업 최적화를 통해 실행시간을 기존 프로그램의 최소 30% 이하로 감소시켰으며 실행시간 기준, 평균적으로 20% 이상의 감소를 보였다 커널 이용률 또한 87% 이상 높아졌으며 전반적인 실행시간을 20% 이상 감소하였음을 보였다.
키워드: 병렬처리, GPU, GPGPU, OpenCL, 아키텍쳐

목차

그 림 차 례 i
표 차 례 ii
국 문 요 약 iii
1. 서론 1
2. 관련연구 5
2.1 OpenCL API 5
2.2 루프 최적화(Loop-optimization) 8
2.3 메모리 타일링 10
3. GCN 아키텍쳐 12
3.1 GCN 아키텍쳐 개요 12
3.2 메모리 스코프 15
3.3 GCN 디바이스 내 OpenCL 함수 동작 19
4. 아키텍쳐 기반 최적화 22
4.1 충돌(Conflict) 22
4.2 LDS 최적화 25
4.3 작업그룹 및 범위 조정 27
5. 실험 결과 28
5.1 행렬 곱셈 30
5.2 이미지 컨볼루션 33
6. 결론 36
참 고 문 헌 37
ABSTRACT 39

최근 본 자료

전체보기

댓글(0)

0