콘텐츠로 이동

4. 모델 가속

llama.cpp, MLX, vLLM 등의 추론 엔진을 설정하고 관리하여 하드웨어 성능을 최대한 활용하는 방법을 알아봅니다.