nota-ai
/

phiva-4b-hf

Image-Text-to-Text

Inference Endpoints

Model card Files Files and versions Community

jykim310 commited on Jul 5, 2024

Commit

39c1bad

·

verified ·

1 Parent(s): 616ddd5

Create README.md

Files changed (1) hide show

README.md +29 -0

README.md ADDED Viewed

	@@ -0,0 +1,29 @@

+## Usage
+```python
+import requests
+from PIL import Image
+import torch
+from transformers import AutoProcessor, LlavaForConditionalGeneration
+model_id = "nota-ai/phiva-4b-hf"
+prompt = "USER: <image>\nWhat are these?\nASSISTANT:"
+image_file = "http://images.cocodataset.org/val2017/000000039769.jpg"
+model = LlavaForConditionalGeneration.from_pretrained(
+    model_id,
+    torch_dtype=torch.float16,
+    low_cpu_mem_usage=True,
+    attn_implementation="eager"
+).to(0)
+processor = AutoProcessor.from_pretrained(model_id)
+raw_image = Image.open(requests.get(image_file, stream=True).raw)
+inputs = processor(prompt, raw_image, return_tensors='pt').to(0, torch.float16)
+output = model.generate(**inputs, max_new_tokens=200, do_sample=False)
+print(processor.decode(output[0][inputs['input_ids'].shape[-1]:], skip_special_tokens=True))
+```