Spaces:

BAAI
/

SegGPT

Running

App Files Files Community

xinlongwang commited on Apr 13, 2023

Commit

ad02904

1 Parent(s): 81ab7b8

anything in a video

Browse files

Files changed (15) hide show

.gitattributes +12 -0
app.py +63 -8
videos/.DS_Store +0 -0
videos/a_car_is_moving_on_the_road_40.jpg +3 -0
videos/a_car_is_moving_on_the_road_40.mp4 +3 -0
videos/a_man_in_parkour_100.jpg +3 -0
videos/a_man_in_parkour_100.mp4 +3 -0
videos/a_man_is_surfing_3_30.jpg +3 -0
videos/a_man_is_surfing_3_30.mp4 +3 -0
videos/child-riding_lego.jpg +3 -0
videos/child-riding_lego.mp4 +3 -0
videos/horse-running.jpg +3 -0
videos/horse-running.mp4 +3 -0
videos/jeep-moving.jpg +3 -0
videos/jeep-moving.mp4 +3 -0

.gitattributes CHANGED Viewed

@@ -36,3 +36,15 @@ rainbow.gif filter=lfs diff=lfs merge=lfs -text
 rainbow_.gif filter=lfs diff=lfs merge=lfs -text
 rainbow__.gif filter=lfs diff=lfs merge=lfs -text
 rainbow2.gif filter=lfs diff=lfs merge=lfs -text

 rainbow_.gif filter=lfs diff=lfs merge=lfs -text
 rainbow__.gif filter=lfs diff=lfs merge=lfs -text
 rainbow2.gif filter=lfs diff=lfs merge=lfs -text
+videos/jeep-moving.jpg filter=lfs diff=lfs merge=lfs -text
+videos/a_car_is_moving_on_the_road_40.mp4 filter=lfs diff=lfs merge=lfs -text
+videos/a_man_in_parkour_100.jpg filter=lfs diff=lfs merge=lfs -text
+videos/a_man_in_parkour_100.mp4 filter=lfs diff=lfs merge=lfs -text
+videos/child-riding_lego.jpg filter=lfs diff=lfs merge=lfs -text
+videos/child-riding_lego.mp4 filter=lfs diff=lfs merge=lfs -text
+videos/jeep-moving.mp4 filter=lfs diff=lfs merge=lfs -text
+videos/a_car_is_moving_on_the_road_40.jpg filter=lfs diff=lfs merge=lfs -text
+videos/a_man_is_surfing_3_30.jpg filter=lfs diff=lfs merge=lfs -text
+videos/a_man_is_surfing_3_30.mp4 filter=lfs diff=lfs merge=lfs -text
+videos/horse-running.jpg filter=lfs diff=lfs merge=lfs -text
+videos/horse-running.mp4 filter=lfs diff=lfs merge=lfs -text

app.py CHANGED Viewed

@@ -53,6 +53,32 @@ def inference_mask1(prompt,
         res.append(np.uint8(np.array(Image.open(io.BytesIO(base64.b64decode(a[i]))))))
     return res
 def resizeImg(img):
     res, hres = 448, 448
     img = Image.fromarray(img).convert("RGB")
@@ -61,13 +87,13 @@ def resizeImg(img):
     img.save(temp, format="WEBP")
     return base64.b64encode(temp.getvalue()).decode('ascii')
-def inference_mask_cat(
-              prompt,
-              img,
-              img_,
-              ):
-    output_list = [img, img_]
-    return output_list
 # define app features and run
@@ -88,6 +114,15 @@ examples_sam = [
             ['./images/ydt_2.jpg', './images/ydt_1.jpg', './images/ydt_3.jpg'],
            ]
 demo_mask = gr.Interface(fn=inference_mask1,
                    inputs=[gr.ImageMask(brush_radius=8, label="prompt (提示图)"), gr.Image(label="img1 (测试图1)"), gr.Image(label="img2 (测试图2)")],
@@ -134,6 +169,26 @@ demo_mask_sam = gr.Interface(fn=inference_mask1_sam,
                    allow_flagging="never",
                    )
 title = "SegGPT: Segmenting Everything In Context<br> \
 <div align='center'> \
 <h2><a href='https://arxiv.org/abs/2304.03284' target='_blank' rel='noopener'>[paper]</a> \
@@ -144,7 +199,7 @@ title = "SegGPT: Segmenting Everything In Context<br> \
 </div> \
 "
-demo = gr.TabbedInterface([demo_mask_sam, demo_mask], ['SAM+SegGPT (一触百通)', 'General 1-shot'], title=title)
 #demo.launch(share=True, auth=("baai", "vision"))
 demo.launch(enable_queue=False)

         res.append(np.uint8(np.array(Image.open(io.BytesIO(base64.b64decode(a[i]))))))
     return res
+def inference_mask_video(
+              prompt,
+              vid,
+              request: gr.Request,
+              ):
+    files = {
+        "pimage" : resizeImgIo(prompt["image"]),
+        "pmask" : resizeImgIo(prompt["mask"]),
+        "video" : open(vid, 'rb'),
+    }
+    r = requests.post("http://120.92.79.209/painter/runVideo", files = files)
+    '''
+    path = str(uuid.uuid4()) + "." + str(time.time())
+    fName = 'out.mp4'
+    file_out = "video/" + path + "." + fName
+    with open(file_out,"wb") as f:
+        f.write(r.content)
+    '''
+    a = json.loads(r.text)
+    return [np.uint8(np.array(Image.open(io.BytesIO(base64.b64decode(a["mask"]))))), a["url"]]
 def resizeImg(img):
     res, hres = 448, 448
     img = Image.fromarray(img).convert("RGB")
     img.save(temp, format="WEBP")
     return base64.b64encode(temp.getvalue()).decode('ascii')
+def resizeImgIo(img):
+    res, hres = 448, 448
+    img = Image.fromarray(img).convert("RGB")
+    img = img.resize((res, hres))
+    temp = io.BytesIO()
+    img.save(temp, format="WEBP")
+    return io.BytesIO(temp.getvalue())
 # define app features and run
             ['./images/ydt_2.jpg', './images/ydt_1.jpg', './images/ydt_3.jpg'],
            ]
+examples_video = [
+            ['./videos/horse-running.jpg', './videos/horse-running.mp4'],
+            ['./videos/a_man_is_surfing_3_30.jpg', './videos/a_man_is_surfing_3_30.mp4'],
+    ['./videos/a_car_is_moving_on_the_road_40.jpg', './videos/a_car_is_moving_on_the_road_40.mp4'],
+['./videos/jeep-moving.jpg', './videos/jeep-moving.mp4'],
+['./videos/child-riding_lego.jpg', './videos/child-riding_lego.mp4'],
+]
 demo_mask = gr.Interface(fn=inference_mask1,
                    inputs=[gr.ImageMask(brush_radius=8, label="prompt (提示图)"), gr.Image(label="img1 (测试图1)"), gr.Image(label="img2 (测试图2)")],
                    allow_flagging="never",
                    )
+demo_mask_video = gr.Interface(fn=inference_mask_video,
+                   inputs=[gr.ImageMask(label="prompt (提示图)"), gr.Video(label="video (测试视频)").style(height=448, width=448)],
+                    outputs=[gr.Image(label="SAM output (mask)").style(height=256, width=256), gr.Video().style(height=448, width=448)],
+                    examples=examples_video,
+                    description="<p> \
+                    <strong>SegGPT+SAM: One touch for any segmentation in a video.</strong> <br>\
+                    Choose an example below &#128293; &#128293;  &#128293; <br>\
+                    Or, upload by yourself: <br>\
+                    1. Upload a video to be tested to 'video'. If failed, please check the codec, we recommend h.264 by default. <br>2. Upload a prompt image to 'prompt' and draw <strong>a point or line on the target</strong>.  <br>\
+<br> \
+💎 SAM segments the target with any point or scribble, then SegGPT segments the whole video. <br>\
+💎 Examples below were never trained and are randomly selected for testing in the wild. <br>\
+💎 Current UI interface only unleashes a small part of the capabilities of SegGPT, i.e., 1-shot case. <br> \
+                Note: we only take the first 16 frames for the demo.    \
+</p>",
+                   )
 title = "SegGPT: Segmenting Everything In Context<br> \
 <div align='center'> \
 <h2><a href='https://arxiv.org/abs/2304.03284' target='_blank' rel='noopener'>[paper]</a> \
 </div> \
 "
+demo = gr.TabbedInterface([demo_mask_sam, demo_mask_video, demo_mask], ['SAM+SegGPT (一触百通)', '🎬Anything in a Video', 'General 1-shot'], title=title)
 #demo.launch(share=True, auth=("baai", "vision"))
 demo.launch(enable_queue=False)

videos/.DS_Store ADDED Viewed

Binary file (6.15 kB). View file

videos/a_car_is_moving_on_the_road_40.jpg ADDED Viewed

Git LFS Details

SHA256: 10daa18f2e97d4ee2318f1afc14af43e17d0a040414f52ad3d96b547a962070f
Pointer size: 132 Bytes
Size of remote file: 1.54 MB

videos/a_car_is_moving_on_the_road_40.mp4 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5e69783eed3294b0a76c147d46ce8705a46c21ae4122edc0fd9a2b57ee453954
+size 248227

videos/a_man_in_parkour_100.jpg ADDED Viewed

Git LFS Details

SHA256: 63bcaad8d862552449118379adc8c277a5c61d35d5d0c4eb771016a04fdfccf2
Pointer size: 132 Bytes
Size of remote file: 2.18 MB

videos/a_man_in_parkour_100.mp4 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:dda65f31336de9f9ed607fe60443164a8529b98d949b7cb8e068a2245352e2e3
+size 1020054

videos/a_man_is_surfing_3_30.jpg ADDED Viewed

Git LFS Details

SHA256: 14da330e073633607b72501b2a9c4a5be0c49f61a3de799366df8ee0dded1afd
Pointer size: 132 Bytes
Size of remote file: 1.01 MB

videos/a_man_is_surfing_3_30.mp4 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:73633b80752cefe0e68fb3bf6d1117d5bc1c094c4198c871beb7b59c6856f2f7
+size 301229

videos/child-riding_lego.jpg ADDED Viewed

Git LFS Details

SHA256: 738a855aff8883a4d3a15b619f5e00fee99d4004e409832801b8fead5c362e47
Pointer size: 130 Bytes
Size of remote file: 21.5 kB

videos/child-riding_lego.mp4 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:24a9ffd1a3a430851bb864f3fe1da4e84aed8d9694aea42d1f1578e7ef4818b4
+size 117189

videos/horse-running.jpg ADDED Viewed

Git LFS Details

SHA256: 06009d69b9da293a5f34c1dad221efd4022568a1232edb5e131228c539f8a1e9
Pointer size: 132 Bytes
Size of remote file: 1.01 MB

videos/horse-running.mp4 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:dfd8b6c99776f291bf4c8787721387d8764c85b787741c665dee49dfb6442630
+size 383635

videos/jeep-moving.jpg ADDED Viewed

Git LFS Details

SHA256: e61812ffd152c44f7b67e4a0d33f2d79c9d074fa431f6ea83a316a05f6f25a88
Pointer size: 130 Bytes
Size of remote file: 36.9 kB

videos/jeep-moving.mp4 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:92c2b38d7c52d8a19be7aa7f568d1d07b5fc433cbd369f45e028325230ad76ba
+size 150698