ibm-granite
/

granitelib-guardian-r1.0

@@ -78,7 +78,14 @@ def make_prompt(query: str, response: str, contexts: list, tokenizer):
 # Load the model
 BASE_PATH = "ibm-granite/granite-4.0-micro"
-LORA_PATH = "path/to/factuality_detection/lora/adapter"
 sampling_params = SamplingParams(max_tokens=30, temperature=0.0, seed=42)
 lora_request = LoRARequest("adapter1", 1, LORA_PATH)
 model = LLM(model=BASE_PATH, tensor_parallel_size=1, gpu_memory_utilization=0.95, dtype="bfloat16", enable_lora=True, max_lora_rank=128)

 # Load the model
 BASE_PATH = "ibm-granite/granite-4.0-micro"
+adapter_repo = "ibm-granite/granitelib-guardian-r1.0"
+adapter_subfolder = "factuality-detection/granite-4.0-micro/lora"
+# Download adapter to local cache and get path
+local_repo = snapshot_download(adapter_repo, allow_patterns=f"{adapter_subfolder}/*")
+adapter_path = f"{local_repo}/{adapter_subfolder}"
+LORA_PATH = adapter_path
 sampling_params = SamplingParams(max_tokens=30, temperature=0.0, seed=42)
 lora_request = LoRARequest("adapter1", 1, LORA_PATH)
 model = LLM(model=BASE_PATH, tensor_parallel_size=1, gpu_memory_utilization=0.95, dtype="bfloat16", enable_lora=True, max_lora_rank=128)