ch05-matrix


튜닝 방식 (Method)	정밀도 (Precision)	필요 VRAM (13B 모델 기준)	비고
Full Fine-Tuning	16-bit (FP16)	> 100 GB	가중치 + 그레이디언트 + 옵티마이저 상태(Adam) 저장 필요. A100(80GB) 2장 이상 필요.
LoRA	16-bit (FP16)	~ 24 GB	가중치 동결(Frozen), 어댑터만 학습. RTX 3090/4090 1장으로 가능.
QLoRA	4-bit (Quantized)	~ 12-16 GB	기본 모델을 4비트로 양자화하여 메모리 더욱 절감. 소비자용 GPU에서 구동 용이.

¶ 제5장: 행렬과 왜곡 (Matrix & Distortion) - 공간을 빚어내는 보이지 않는 손