TGI_ssh

text-generation-inference的使用環境，可以省去下載套件的時間

build image

版本可自行進行替換

$ cd TGI_ssh
$ docker build -t tgi_ssh:1.4 .

model volume

預設放在./data資料夾
會綁定到container中的/data
模型直接丟進去就行

run ssh TGI

$ cd TGI_ssh
$ docker-compose -f docker-compose-ssh.yml up -d

docker-compose-ssh.yml中
"port1:22"是ssh的port，
"port2:80"是服務的port，
PASSWORD改成自己要的密碼，

如果是Ampere的GPU(30系、40系、A6000)要指定顯卡id或數量

    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              device_ids:
                - "0"
                - "1"

如果是非Ampere的GPU(titan)要指定all就行，而且dtype只能是float16

    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              count: all

連接時輸入以下指令
可登入root
密碼為先前設定的值

$ ssh -p ${port1} root@${ip}

開啟服務方式參考 TGI
example :

$ nohup text-generation-launcher --model-id /data/MediaTek-Research/Breeze-7B-Instruct-v0_1 --trust-remote-code --dtype bfloat16 --max-input-length 8191 --max-total-tokens 8192 --max-batch-prefill-tokens 8192 &> /dev/null&

服務會開在port2
如果要關掉可透過ps -ef查看所有與TGI相關的進程
然後透過kill -9 ${pid}關閉

run TGI service

直接開啟服務，沒有ssh登入

docker-compose-service.yml中
model-id可設定huggingface的model-id或直接用local模型
如果是Ampere的GPU(30系、40系、A6000)要指定顯卡id或數量

    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              device_ids:
                - "0"
                - "1"

如果是非Ampere的GPU(titan)要指定all就行，而且dtype只能是float16

    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              count: all

$ cd TGI_ssh
$ docker-compose -f docker-compose-service.yml up -d

Name		Name	Last commit message	Last commit date
Latest commit History 23 Commits
data		data
Dockerfile		Dockerfile
README.md		README.md
docker-compose-service.yml		docker-compose-service.yml
docker-compose-ssh.yml		docker-compose-ssh.yml
entrypoint.sh		entrypoint.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

TGI_ssh

build image

model volume

run ssh TGI

run TGI service

About

Releases

Packages

Languages

NCHU-NLP-Lab/TGI_ssh

Folders and files

Latest commit

History

Repository files navigation

TGI_ssh

build image

model volume

run ssh TGI

run TGI service

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages