Module 1 – Proxmox VE(KVM) 심화 및 가상화 준비
Proxmox VE 설치 및 핵심 아키텍처 (KVM/QEMU, LXC)
IOMMU (VT-d / AMD-Vi) 활성화 및 커널 파라미터 설정 (vfio-pci) (오류 해결 및 디버깅 중심)
Proxmox 네트워킹 심화 (Linux Bridge, VLAN) 및 스토리지 구성
Module 2 – 고성능: PCIe Passthrough Deep Dive
RTX 3000/4000 시리즈 GPU 호스트 드라이버 블랙리스트 및 VFIO 바인딩
VM 생성 및 물리 GPU(RTX 4090 등) Passthrough 설정
'Error 43' 우회 및 KVM 설정 최적화 (vBIOS 덤프, CPU Pinning)
VM 내부 nvidia-smi 검증 및 LLM (PyTorch) 구동 테스트
Module 3 – 자원 분할: Enterprise vGPU 원리 및 MDEV 분할
vGPU(GRID) vs MIG 기술 비교
지원 카드 vGPU 호스트 드라이버 설치
vGPU MDEV 프로파일 생성 및 VM에 vGPU 할당
vGPU VM 내부 vGPU 게스트 드라이버 설치
Module 4 – NVIDIA DLS (라이선스 서버) 구축 및 vGPU 활성화
NVAIE (NVIDIA AI Enterprise) 라이선스 정책 이해
NVAIE 평가판 신청, 발급, 라이선스 파일 다운로드
DLS(Dedicated License Server) VM 구축 및 라이선스 서버 활성화
vGPU VM이 DLS 서버에서 라이선스를 할당받도록 구성 및 nvidia-smi 최종 검증
Module 5 – K8s GPU Operator 연동 및 AI 워크로드
NVIDIA GPU Operator 아키텍처 및 Passthrough/vGPU 지원 원리
K8s 클러스터에 GPU Operator 설치 (Passthrough 노드용)
K8s 클러스터에 GPU Operator 설치 (vGPU 노드용 설정 적용)
Node Feature Discovery(NFD)를 이용한 GPU 타입별(Passthrough vs vGPU) 워크로드 스케줄링
00
일
00
시
00
분
00
초
Tags