feat: Organize Inference Files - Part 1 (#216)

This is the first part towards the new inference pipeline - organizing inference files into their own folder. This way we can easier trigger build pipelines (edits to presets/models/inference) as well as maintain/add new types of inference
Azure · Jan 26, 2024 · ecc56d1 · ecc56d1
1 parent d334f26
commit ecc56d1
Show file tree

Hide file tree

Showing 11 changed files with 208 additions and 171 deletions.
diff --git a/pkg/inference/preset-inference-types.go b/pkg/inference/preset-inference-types.go
@@ -48,7 +48,6 @@ var (
 	}
 
 	DefaultAccelerateParams = map[string]string{
-		"config_file":   DefaultConfigFile,
 		"num_processes": DefaultNumProcesses,
 		"num_machines":  DefaultNumMachines,
 		"machine_rank":  DefaultMachineRank,

diff --git a/presets/models/falcon/config.yaml b/presets/models/falcon/config.yaml
diff --git a/presets/models/falcon/inference-api.py b/presets/models/falcon/inference-api.py
diff --git a/presets/models/llama2chat/inference-api.py → ...ls/inference/llama2-chat/inference-api.py b/presets/models/llama2chat/inference-api.py → ...ls/inference/llama2-chat/inference-api.py
@@ -1,21 +1,21 @@
 # Copyright (c) Microsoft Corporation.
 # Licensed under the MIT license.
-from fastapi import FastAPI, HTTPException
-import uvicorn
-from pydantic import BaseModel
-from typing import Optional
+import argparse
+import functools
 import multiprocessing
 import multiprocessing.pool
+import os
+import signal
+import sys
 import threading
-import functools
+from typing import Optional
 
-from llama import Llama
 import torch
-import sys
-import signal
-import os
 import torch.distributed as dist
-import argparse
+import uvicorn
+from fastapi import FastAPI, HTTPException
+from llama import Llama
+from pydantic import BaseModel
 
 # Setup argparse
 parser = argparse.ArgumentParser(description="Llama API server.")

diff --git a/presets/models/llama2/inference-api.py → ...erence/llama2-completion/inference-api.py b/presets/models/llama2/inference-api.py → ...erence/llama2-completion/inference-api.py
@@ -1,21 +1,21 @@
 # Copyright (c) Microsoft Corporation.
 # Licensed under the MIT license.
-from fastapi import FastAPI, HTTPException
-import uvicorn
-from pydantic import BaseModel
-from typing import Optional
+import argparse
+import functools
 import multiprocessing
 import multiprocessing.pool
+import os
+import signal
+import sys
 import threading
-import functools
+from typing import Optional
 
-from llama import Llama
 import torch
-import sys
-import signal
-import os
 import torch.distributed as dist
-import argparse
+import uvicorn
+from fastapi import FastAPI, HTTPException
+from llama import Llama
+from pydantic import BaseModel
 
 # Setup argparse
 parser = argparse.ArgumentParser(description="Llama API server.")