lint

mosaicml · Dec 8, 2023 · 68f078e · 68f078e
1 parent c13d9fd
commit 68f078e
Show file tree

Hide file tree

Showing 2 changed files with 31 additions and 26 deletions.
diff --git a/llmfoundry/utils/prompt_files.py b/llmfoundry/utils/prompt_files.py
@@ -71,31 +71,33 @@ def load_prompts_from_file(prompt_path: str,
 
 
 def load_prompts_from_remote(prompt_path: str,
-                             prompt_delimiter: Optional[str] = None) -> List[str]:
-        """Load a set of prompts from object storage.
-    
-        Args:
-            prompt_path (str): Path for text file
-            prompt_delimiter (Optional str): Delimiter for text file
-                If not provided, assumes the prompt file is a single prompt (non-delimited)
-
-        Returns:
-            List of prompt string(s)
-        """
-        backend, _, _ = parse_uri(prompt_path)
-        if backend in ['', None]:
-            raise ValueError(
-                f'prompt_path_str must start with s3:// etc if using object storage')
-
-        local_path = prompt_path.split('/')[-1]
-        get_file(path=prompt_path, destination=local_path, overwrite=True)
-
-        with open(local_path, 'r') as f:
-            prompt_string = f.read()
-
-        if prompt_delimiter is None:
-            return [prompt_string]
-        return [i for i in prompt_string.split(prompt_delimiter) if i]
+                             prompt_delimiter: Optional[str] = None
+                            ) -> List[str]:
+    """Load a set of prompts from object storage.
+
+    Args:
+        prompt_path (str): Path for text file
+        prompt_delimiter (Optional str): Delimiter for text file
+            If not provided, assumes the prompt file is a single prompt (non-delimited)
+
+    Returns:
+        List of prompt string(s)
+    """
+    backend, _, _ = parse_uri(prompt_path)
+    if backend in ['', None]:
+        raise ValueError(
+            f'prompt_path_str must start with s3:// etc if using object storage'
+        )
+
+    local_path = prompt_path.split('/')[-1]
+    get_file(path=prompt_path, destination=local_path, overwrite=True)
+
+    with open(local_path, 'r') as f:
+        prompt_string = f.read()
+
+    if prompt_delimiter is None:
+        return [prompt_string]
+    return [i for i in prompt_string.split(prompt_delimiter) if i]
 
 
 def load_prompts_from_dataset(dataset_path: str,

diff --git a/scripts/inference/hf_generate.py b/scripts/inference/hf_generate.py
@@ -278,7 +278,10 @@ def _generate(encoded_inp: Dict[str, torch.Tensor]):
             print(f'\nTokenizing prompts...')
             maybe_synchronize()
             encode_start = time.time()
-            encoded_inp = tokenizer(batch, return_tensors='pt', padding=True, truncation=True)
+            encoded_inp = tokenizer(batch,
+                                    return_tensors='pt',
+                                    padding=True,
+                                    truncation=True)
             for key, value in encoded_inp.items():
                 encoded_inp[key] = value.to(model.device)
             maybe_synchronize()