콘텐츠로 이동

Backend.AI GO

4. 모델 가속

English
한국어

검색 초기화

홈
시작하기
핵심 기능
Cowork
모델 가속
API 서버
클라우드 통합
멀티 노드
고급 주제
활용 사례
레퍼런스

Backend.AI GO

홈
시작하기
시작하기
핵심 기능
핵심 기능
Cowork
Cowork
모델 가속
모델 가속
- 개요
- 엔진 관리
- llama.cpp
- MLX
- stable-diffusion.cpp
- vLLM
API 서버
API 서버
- Continuum Router
- 외부 접속 설정
클라우드 통합
클라우드 통합
멀티 노드
멀티 노드
고급 주제
고급 주제
활용 사례
활용 사례
레퍼런스
레퍼런스

4. 모델 가속¶

llama.cpp, MLX, vLLM 등의 추론 엔진을 설정하고 관리하여 하드웨어 성능을 최대한 활용하는 방법을 알아봅니다.

MCP 연동하기

Made with Material for MkDocs