1 15 32

Zilong Huang

SereinH

AI & ML interests

None yet

Recent Activity

upvoted a paper about 11 hours ago

SceneGen: Single-Image 3D Scene Generation in One Feedforward Pass

authored a paper 8 days ago

Echo-4o: Harnessing the Power of GPT-4o Synthetic Images for Improved Image Generation

upvoted a paper 9 days ago

Echo-4o: Harnessing the Power of GPT-4o Synthetic Images for Improved Image Generation

View all activity

Organizations

None yet

upvoted a paper about 11 hours ago

SceneGen: Single-Image 3D Scene Generation in One Feedforward Pass

Paper • 2508.15769 • Published 1 day ago • 10

upvoted a paper 9 days ago

Echo-4o: Harnessing the Power of GPT-4o Synthetic Images for Improved Image Generation

Paper • 2508.09987 • Published 9 days ago • 24

upvoted a paper 13 days ago

Sel3DCraft: Interactive Visual Prompts for User-Friendly Text-to-3D Generation

Paper • 2508.00428 • Published 22 days ago • 3

upvoted a paper 3 months ago

Scenethesis: A Language and Vision Agentic Framework for 3D Scene Generation

Paper • 2505.02836 • Published May 5 • 7

upvoted a paper 4 months ago

OmniSVG: A Unified Scalable Vector Graphics Generation Model

Paper • 2504.06263 • Published Apr 8 • 180

upvoted 3 papers 5 months ago

GPT-ImgEval: A Comprehensive Benchmark for Diagnosing GPT4o in Image Generation

Paper • 2504.02782 • Published Apr 3 • 58

Spot the Fake: Large Multimodal Model-Based Synthetic Image Detection with Artifact Explanation

Paper • 2503.14905 • Published Mar 19 • 20

LEGION: Learning to Ground and Explain for Synthetic Image Detection

Paper • 2503.15264 • Published Mar 19 • 21

upvoted a paper 7 months ago

MangaNinja: Line Art Colorization with Precise Reference Following

Paper • 2501.08332 • Published Jan 14 • 61

upvoted 2 papers 9 months ago

Imagine360: Immersive 360 Video Generation from Perspective Anchor

Paper • 2412.03552 • Published Dec 4, 2024 • 29

SOLAMI: Social Vision-Language-Action Modeling for Immersive Interaction with 3D Autonomous Characters

Paper • 2412.00174 • Published Nov 29, 2024 • 23

upvoted a paper 10 months ago

LOKI: A Comprehensive Synthetic Data Detection Benchmark using Large Multimodal Models

Paper • 2410.09732 • Published Oct 13, 2024 • 56

upvoted a paper 11 months ago

MinerU: An Open-Source Solution for Precise Document Content Extraction

Paper • 2409.18839 • Published Sep 27, 2024 • 29

upvoted 2 papers 12 months ago

CrossViewDiff: A Cross-View Diffusion Model for Satellite-to-Street View Synthesis

Paper • 2408.14765 • Published Aug 27, 2024 • 15

UrBench: A Comprehensive Benchmark for Evaluating Large Multimodal Models in Multi-View Urban Scenarios

Paper • 2408.17267 • Published Aug 30, 2024 • 24

Zilong Huang

AI & ML interests

Recent Activity

Organizations

SereinH's activity