devanshamin
/

Qwen2-1.5B-Instruct-Function-Calling-v1

Text Generation

Generated from Trainer

Model card Files Files and versions

devanshamin commited on Jul 6, 2024

Commit

486a7e9

·

verified ·

1 Parent(s): feef0a1

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -57,7 +57,7 @@ model = AutoModelForCausalLM.from_pretrained(model_id, torch_dtype=torch.float32
 tokenizer = AutoTokenizer.from_pretrained(model_id)
 def inference(prompt: str) -> str:
-  model_inputs = tokenizer([prompt], return_tensors="pt").to(device)
   generated_ids = model.generate(model_inputs.input_ids, max_new_tokens=512)
   generated_ids = [output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)]
   response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]

 tokenizer = AutoTokenizer.from_pretrained(model_id)
 def inference(prompt: str) -> str:
+  model_inputs = tokenizer([prompt], return_tensors="pt").to('cuda')
   generated_ids = model.generate(model_inputs.input_ids, max_new_tokens=512)
   generated_ids = [output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)]
   response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]