Spaces:

lixin4ever
/

VideoRefer-VideoLLaMA3

Running on Zero

CircleRadon commited on 9 days ago

Commit

ef28fa7

verified ·

1 Parent(s): 5eef352

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -13,6 +13,7 @@ sys.path.append('./')
 from videollama3 import disable_torch_init, model_init, mm_infer, get_model_output
 from videollama3.mm_utils import load_images
 from videollama3.mm_utils import load_video
 color_rgb = (1.0, 1.0, 1.0)
@@ -54,6 +55,7 @@ def add_contour(img, mask, color=(1., 1., 1.)):
     return img
 def generate_masks(image):
     global mask_list
     global mask_raw_list
@@ -82,6 +84,7 @@ def generate_masks(image):
     return mask_list, image
 def generate_masks_video(image):
     global mask_list_video
     global mask_raw_list_video
@@ -110,7 +113,7 @@ def generate_masks_video(image):
     return mask_list_video, image
 def describe(image, mode, query, masks):
     # Create an image object from the uploaded image
     # print(image.keys())
@@ -211,6 +214,7 @@ def load_first_frame(video_path):
     image = Image.fromarray(frame)
     return image
 def describe_video(video_path, mode, query, annotated_frame, masks):
     global mask_list_video
     # Create a temporary directory to save extracted video frames
@@ -319,7 +323,7 @@ def describe_video(video_path, mode, query, annotated_frame, masks):
         yield gr.update(), text, gr.update()
 def apply_sam(image, input_points):
     inputs = sam_processor(image, input_points=input_points, return_tensors="pt").to(device)

 from videollama3 import disable_torch_init, model_init, mm_infer, get_model_output
 from videollama3.mm_utils import load_images
 from videollama3.mm_utils import load_video
+import spaces
 color_rgb = (1.0, 1.0, 1.0)
     return img
+@spaces.GPU(duration=120)
 def generate_masks(image):
     global mask_list
     global mask_raw_list
     return mask_list, image
+@spaces.GPU(duration=120)
 def generate_masks_video(image):
     global mask_list_video
     global mask_raw_list_video
     return mask_list_video, image
+@spaces.GPU(duration=120)
 def describe(image, mode, query, masks):
     # Create an image object from the uploaded image
     # print(image.keys())
     image = Image.fromarray(frame)
     return image
+@spaces.GPU(duration=120)
 def describe_video(video_path, mode, query, annotated_frame, masks):
     global mask_list_video
     # Create a temporary directory to save extracted video frames
         yield gr.update(), text, gr.update()
+@spaces.GPU(duration=120)
 def apply_sam(image, input_points):
     inputs = sam_processor(image, input_points=input_points, return_tensors="pt").to(device)