From ba2310644408766e6f266689f4b0488806a6d387 Mon Sep 17 00:00:00 2001
From: bjwswang <bjwswang@gmail.com>
Date: Wed, 10 Jan 2024 10:37:42 +0000
Subject: [PATCH] fix: skip to create embedder if worker is utilizing vllm

Signed-off-by: bjwswang <bjwswang@gmail.com>
---
 pkg/worker/worker.go | 5 ++++-
 1 file changed, 4 insertions(+), 1 deletion(-)

diff --git a/pkg/worker/worker.go b/pkg/worker/worker.go
index dc42f92f1..c8d896716 100644
--- a/pkg/worker/worker.go
+++ b/pkg/worker/worker.go
@@ -321,7 +321,10 @@ func (podWorker *PodWorker) BeforeStart(ctx context.Context) error {
 
 	// prepare LLM/Embedder
 	model := podWorker.Model()
-	if model.IsEmbeddingModel() {
+
+	// If worker is utilizing vllm, then we should not create embedder for it
+	// vllm doesn't support embedding apis.See https://github.com/vllm-project/vllm/issues/183
+	if model.IsEmbeddingModel() && podWorker.Worker().Type() != arcadiav1alpha1.WorkerTypeFastchatVLLM {
 		embedder := &arcadiav1alpha1.Embedder{}
 		err := podWorker.c.Get(ctx, types.NamespacedName{Namespace: podWorker.Namespace, Name: podWorker.Name}, embedder)
 		switch ActionOnError(err) {