메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

지현정 (경희대학교, 경희대학교 대학원)

지도교수
홍충선
발행연도
2019
저작권
경희대학교 논문은 저작권에 의해 보호받습니다.

이용수4

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
Layer 2 네트워크는 MAC address lookup 만으로 패킷 포워딩이 가능하고 설정과 관리가 상대적으로 단순하다는 장점이 있다. 하지만 Layer 2 네트워크에서는 Flooding 패킷에 대한 처리가 필요하다. 네트워크 토폴로지 상으로 loop가 존재하는 경우 Input Port를 제외한 전체 Port로 패킷을 복제하여 전송하는 Flooding 동작은 네트워크에 치명적인 문제가 될 수 있다. IEEE 802 표준에서는 이러한 상황을 대비 하고 사용 중이던 경로에 문제가 생겼을 때 대체 경로로의 자동적인 전환을 위해 Spanning Tree Protocol (STP)을 제안하고 있다. 하지만 STP의 경우 두 개의 노드 사이에서 오직 하나의 경로만을 허용하기 때문에 전체 네트워크 내에서 사용 가능 한 물리적 자원을 충분히 활용하지 못하는 문제가 있다. 개별 스위치는 미리 정의 된 대역폭과 HOP count 만을 기준으로 경로를 설정하고, 하나의 스위치가 전체 네 트워크에 대한 가시권과 통제권을 갖지 못하기 때문에 나타나는 제약사항이다. 최 근 등장한 Software Defined Network (SDN)의 경우 목적지까지의 경로를 결정하는 Control Plane과 패킷의 포워딩을 담당하는 Data Plane이 분리된 구조를 갖는다. Data Plane에서 분리된 Control Plane은 중앙에서 모든 스위치와 직접 정보를 주고 받으며 각 스위치의 패킷 포워딩을 통제한다.
본 논문에서는 SDN 환경에서 강화학습 알고리즘을 이용하여 Layer 2 네트워크의 경로를 설정하는 방법을 제안한다. 강화학습 문제를 기술하는 State, Action, Reward 는 다음과 같이 정의한다. State는 네트워크에서 패킷 포워딩을 담당하는 각 스위치 가 된다. Action은 현재 스위치 내에서 패킷의 전송을 담당할 Output Port를 선택하 는 것으로 정의한다. Reward는 현재 State에 해당하는 스위치와 다음 State가 될 스 위치 사이의 링크 정보와 현재 State 스위치 내에서 선택된 Port의 사용비율이 반영 된 값이다. Reward 값 계산과 Flooding Port 설정을 위해 사용되는 링크 정보는 링 크 Layer Discovery Protocol (LLDP)를 통해 수집된 정보를 기반으로 한다. 제안된 알고리즘을 적용하였을 때 loop-free라는 조건을 만족시키면서 목적지까지의 경로 설정이 가능한 것을 확인하였다. 성능 측정을 통해서는 동일 토폴로지에서 STP에 비해 향상된 Throughput과 Latency 결과를 보여줌을 확인할 수 있었다.

목차

1. 서론 1
1.1. 연구배경 및 목적 1
1.2. Layer 2 네트워크의 패킷 포워딩과 STP 3
2. 관련 기술 및 연구 6
2.1. SDN 컨트롤러에 의한 패킷 경로 설정 6
2.2. 강화학습 알고리즘 8
3. 강화학습을 이용한 Layer 2 경로 선택 제안 10
3.1. 네트워크 토폴로지 정보 수집 10
3.2. Port 트래픽 사용 정보 수집 14
3.3. Reward 값 계산과 Q-table 생성 15
3.4. 생성된 Q-table을 이용한 경로 선택 절차 17
4. 성능 평가 21
4.1. 경로 선택 결과 비교 21
4.2. 성능 측정을 위한 테스트 시나리오 21
4.3. 성능 측정결과 분석 23
5. 결론 및 향후 과제 24

최근 본 자료

전체보기

댓글(0)

0