메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술대회자료
저자정보
이영현 (한양대학교) 김혜준 (연세대학교) 유용승 (한양대학교) 조명진 (사피온 코리아) 서지원 (한양대학교) 박영준 (연세대학교)
저널정보
대한전자공학회 대한전자공학회 학술대회 2023년도 대한전자공학회 추계학술대회 논문집
발행연도
2023.11
수록면
679 - 683 (5page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
As the AI industry evolves, neural network processing units (NPUs) are being developed to deliver AI services faster and more efficiently. One of the most important challenges for these NPUs is task scheduling to minimize off-chip memory accesses, which incur significant performance overhead. In particular, convolutional layers can be fused with multiple layers to reduce the memory accesses, but it is difficult to find the optimal schedule due to the too large exploration space. In this paper, we propose an efficient schedule exploration algorithm to optimize the fusion of multiple convolutional layers in NPUs. The proposed algorithm organizes the fusion group exploration space in the form of a grid to explore the optimal schedule. Experimental results show that the fusion schedule explored by the proposed method reduces the latency by 7.7% and reduces the off-chip memory access by 15% compared to the baseline algorithm.

목차

Abstract
Ⅰ. 서론
Ⅱ. 배경지식 및 연구동기
Ⅲ. 구현
Ⅳ. 평가
Ⅳ. 결론
참고문헌

참고문헌 (0)

참고문헌 신청

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0