라벨이 ai-챗봇인 게시물 표시

도커에서 vllm 사용 설정 가이드

도커에서 vllm 사용 설정 가이드 # 도커에서 gpu를 사용하기 위한 기본설정 호스트 쪽 ✅ NVIDIA 드라이버 ✅ Docker ✅ NVIDIA Container Toolkit (nvidia-container-toolkit) 이미지/컨테이너 쪽 ✅ CUDA / cuDNN 라이브러리 포함된 베이스 이미지 (또는 vLLM/Qwen 공식 이미지) 1. 호스트(서버)에 필요한 것 (1) NVIDIA 드라이버 (반드시 호스트에만 설치) nvidia-smi 잘 나오면 OK  컨테이너 안에는 드라이버 설치하면 안 됨 → 드라이버는 “호스트 전용”, 컨테이너는 라이브러리(CUDA, cuDNN)만 있으면 됨. (2) Docker + NVIDIA Container Toolkit GPU를 Docker에 연결해주는 게 NVIDIA Container Toolkit 이라서 필요. NVIDIA Container Toolkit (nvidia-container-toolkit) 툴킷은 도커 내부에 gpu를 사용할수 있게 해주는 브릿지 역할 # 패키지 저장소 추가 (OS별로 다름, 예시는 Ubuntu) # sudo distribution=$(. /etc/os-release;echo $ID$VERSION_ID) # curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit.gpg # curl -s -L https://nvidia.github.io/libnvidia-container/$distribution/libnvidia-container.list | \ #   sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit.gpg] https://#g' | \ #   sudo tee /et...

허깅페이스 gguf 파일 Modelfile 생성

Modelfile 제작방법 1. 최초에 모델파일을 모르기 때문에 처음에는 Hugging Face GGUF나 기본 모델은 먼저 올리마에 실행후 모델파일 추출 ollama run hf.co/{user}/{repo}:Q4_K_M 2. 기본 설정 추출 ollama show <모델명> --modelfile 명령으로 “Base Modelfile”을 뽑습니다. → 여기엔 FROM , PARAMETER , TEMPLATE , SYSTEM 같은 값이 다 포함돼 있어요. 3. 커스텀  Modelfile 제작 -  기본 설정을 텍스트로 추출 ollama show hf.co/{user}/{repo}:Q4_K_M --modelfile > Base.Modelfile ollama show hf.co/{user}/{repo}:Q4_K_M --parameters   # 참고용 ollama show hf.co/{user}/{repo}:Q4_K_M --template     # 참고용 필요한 부분만 수정해서 내 Modelfile 제작 뽑아온 Base Modelfile을 복사/수정해서 num_ctx (컨텍스트 길이) temperature , top_p , top_k stop 토큰 system 메시지 같은 부분을 원하는 대로 바꾸면 됩니다. # (PARAMETER num_ctx, temperature, stop 토큰 등) vi Modelfile 4) 커스텀 모델 빌드 & 실행 ollama create mymodel -f ./Modelfile ollama run mymodel Modelfile 잘못 설정시 무한반복, 동일문장 재생산 오류 대처법 왜 문제가 생기나? stop 토큰 설정 누락/오류 PARAMETER stop [...] 를 잘못 지정하면 모델이 멈출 지점을 못 찾아 무한 반복합니다. template 문제 TEMPLATE에서 role/use...

개발을 위한 전체 프로젝트 구조 설정

이미지
프로젝트 폴더 구조 정의  src 하위에 아래와 같은 폴더를 생성하여 전체적인 구조를 설정 후 작업한다. @types, a11y,common, componets, data-provider, hooks, locales, Providers, routes, store, utils 각각의 폴더를 만들어서 구분함으로써 나중에 유지 보수 적인 측면이나 여러 모로 용도가 분류 되어야 개발 할때 좀 더 명확하다. 프로젝트를 진행 하면서 하나씩 채워 나갈 예정이다. 먼저 최초의 진입점 화면 부터 구현해 보자. 화면을 구현하기 앞서서 기본 css 파일을 먼저 작성 하겠다. client 최상단 폴더에 mobile.css, style.css 파일을 먼저 작성한다. mobile.css mobile.css 내용이다. .hover-button.active {   display : block ;   visibility : visible ; } .nav-close-button {   margin-left : 8px ; } .nav {   position : fixed ;   z-index : 64 ;   top : 0 ;   /* max-width: 260px; */   bottom : 0 ;   opacity : 0 ; } .nav.active {   position : relative ;   left : 0 ;   opacity : 1 ; } .nav-mask.active {   opacity : 0 ;   pointer-events : auto ; } @media ( max-width : 767px ) {   .nav {     width : calc ( 100% - 10px )  ;     transition : all 0.15s ;   }   .nav-mas...

이 블로그의 인기 게시물

아파치 보안관련 기본설정

티베로 이관 작업 절차

윈도우 네트워크 리소스 사용권한 오류