README.md (#19)

- Update factuality-correction/granite-4.0-micro/README.md (4e11aa83c6e60502f1e5703b11b7459cbb45b1fc)

Files changed (1) hide show

factuality-correction/granite-4.0-micro/README.md CHANGED Viewed

@@ -78,7 +78,14 @@ def make_prompt(query: str, response: str, contexts: list, tokenizer):
 # Load the model
 BASE_PATH = "ibm-granite/granite-4.0-micro"
-LORA_PATH = "/path/to/factuality_correction/lora/adapter"
 sampling_params = SamplingParams(max_tokens=4096, temperature=0.0, seed=42)
 lora_request = LoRARequest("adapter1", 1, LORA_PATH)
 model = LLM(model=BASE_PATH, tensor_parallel_size=1, gpu_memory_utilization=0.95, dtype="bfloat16", enable_lora=True, max_lora_rank=128)

 # Load the model
 BASE_PATH = "ibm-granite/granite-4.0-micro"
+adapter_repo = "ibm-granite/granitelib-guardian-r1.0"
+adapter_subfolder = "factuality-correction/granite-4.0-micro/lora"
+# Download adapter to local cache and get path
+local_repo = snapshot_download(adapter_repo, allow_patterns=f"{adapter_subfolder}/*")
+adapter_path = f"{local_repo}/{adapter_subfolder}"
+LORA_PATH = adapter_path
 sampling_params = SamplingParams(max_tokens=4096, temperature=0.0, seed=42)
 lora_request = LoRARequest("adapter1", 1, LORA_PATH)
 model = LLM(model=BASE_PATH, tensor_parallel_size=1, gpu_memory_utilization=0.95, dtype="bfloat16", enable_lora=True, max_lora_rank=128)