双卡A6000推理，模型推理结束，一张卡GPU利用率为0，一张卡GPU利用率100% #111

zf761 · 2024-08-28T09:34:50Z

TOKENIZER_PATH=/DATA/LM_zhangfeng/models/Qwen2-72B-Instruct-AWQ CHECKPOINT_PATH=/DATA/LM_zhangfeng/models/Qwen2-72B-Instruct-AWQ MODEL_TYPE=qwen_2 FT_SERVER_TEST=1 CUDA_VISIBLE_DEVICES='2,3' START_PORT='18095' ENABLE_FAST_GEN=1 CONCURRENCY_LIMIT=200 PY_LOG_LEVEL=INFO TP_SIZE=2 WORLD_SIZE=2 python3 -m maga_transformer.start_server

netaddi · 2024-09-13T06:31:03Z

This should be a problem caused by nvidia-smi. You may refer to power consumption for its actual usage.

baowendin closed this as completed Oct 24, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

双卡A6000推理，模型推理结束，一张卡GPU利用率为0，一张卡GPU利用率100% #111

双卡A6000推理，模型推理结束，一张卡GPU利用率为0，一张卡GPU利用率100% #111

zf761 commented Aug 28, 2024

netaddi commented Sep 13, 2024

双卡A6000推理，模型推理结束，一张卡GPU利用率为0，一张卡GPU利用率100% #111

双卡A6000推理，模型推理结束，一张卡GPU利用率为0，一张卡GPU利用率100% #111

Comments

zf761 commented Aug 28, 2024

netaddi commented Sep 13, 2024