[CS311] 8. GPU 아키텍처와 CUDA 프로그래밍
CPU/GPU 용어 정리, Hardware Multi-Threading(SMT)부터 GPU 아키텍처(SP, SM), CUDA 프로그래밍과 Tiled Matrix Multiplication까지 정리합니다.
CPU/GPU 용어 정리, Hardware Multi-Threading(SMT)부터 GPU 아키텍처(SP, SM), CUDA 프로그래밍과 Tiled Matrix Multiplication까지 정리합니다.
VLIW와 Superscalar를 통한 명령어 수준 병렬성(ILP)부터 멀티프로세서의 캐시 일관성, 동기화 메커니즘까지 정리합니다.
캐시 메모리의 구조(Direct Mapped, Set Associative)와 성능 분석, 그리고 가상 메모리의 주소 변환, 페이지 테이블, TLB를 정리합니다.
5단계 파이프라인 설계, SC vs Pipeline 비교, 그리고 구조적/데이터/제어 해저드와 그 해결책(포워딩, 스톨, 분기 예측)을 정리합니다.
MIPS 단일 사이클 프로세서의 데이터패스 요소, 제어 유닛, ALU 제어 유닛 설계와 전체 프로세서 회로를 정리합니다.
ISA의 개념부터 MIPS-32의 명령어 형식(R/I/J), 핵심 명령어, 레지스터 규약, 프로시저 호출, 메모리 레이아웃까지 정리합니다.
SRAM과 DRAM의 구조, 2차원 주소 디코딩부터 CPU 성능 평가(CPU Time, CPI, Amdahl’s Law)와 전력 소비까지 정리합니다.
Boolean 대수와 조합 논리 회로(가산기, 디코더, MUX)부터 순차 논리(래치, 플립플롭, 레지스터)까지, 디지털 논리의 핵심을 정리합니다.