OSU NLP Group

university

https://twitter.com/osunlp

osunlp

AI & ML interests

Natural language processing, language models, language agents

Recent Activity

huangtom authored a paper 1 day ago

Mind2Web 2: Evaluating Agentic Search with Agent-as-a-Judge

nnnyt new activity 1 day ago

osunlp/Mind2Web-2:Update README.md

BoyuNLP new activity 1 day ago

osunlp/Mind2Web-2:Update README.md

View all activity

huangtom

authored a paper 1 day ago

Mind2Web 2: Evaluating Agentic Search with Agent-as-a-Judge

Paper • 2506.21506 • Published 2 days ago • 36

nnnyt

in osunlp/Mind2Web-2 1 day ago

Update README.md

#1 opened 1 day ago by

BoyuNLP

in osunlp/Mind2Web-2 1 day ago

Update README.md

#1 opened 1 day ago by

nnnyt

updated a dataset 1 day ago

osunlp/Mind2Web-2

Preview • Updated 1 day ago • 7

BoyuNLP

updated a collection 1 day ago

Mind2Web 2

Evaluating Agentic Search with Agent-as-a-Judge • 2 items • Updated 1 day ago

nnnyt

published a dataset 1 day ago

osunlp/Mind2Web-2

Preview • Updated 1 day ago • 7

BoyuNLP

authored a paper 1 day ago

Mind2Web 2: Evaluating Agentic Search with Agent-as-a-Judge

Paper • 2506.21506 • Published 2 days ago • 36

nnnyt

authored a paper 1 day ago

Mind2Web 2: Evaluating Agentic Search with Agent-as-a-Judge

Paper • 2506.21506 • Published 2 days ago • 36

yhshu

authored a paper 1 day ago

Mind2Web 2: Evaluating Agentic Search with Agent-as-a-Judge

Paper • 2506.21506 • Published 2 days ago • 36

btyu

in osunlp/SMolInstruct 12 days ago

Inquiry on Data Correction Methodology in SMolInstruct

#2 opened 4 months ago by

BoyuNLP

in osunlp/UGround-V1-72B 15 days ago

I want to know, what format of data is the model better at returning?

#2 opened 15 days ago by

flyhero

in osunlp/AutoSDT-5K 17 days ago

Update README.md

#3 opened 17 days ago by

flyhero

updated a dataset 19 days ago

osunlp/AutoSDT-5K

Viewer • Updated 17 days ago • 5.15k • 152 • 3

flyhero

in osunlp/AutoSDT-5K 20 days ago

Update README.md

#2 opened 20 days ago by

flyhero

published a dataset 23 days ago

osunlp/AutoSDT-5K

Viewer • Updated 17 days ago • 5.15k • 152 • 3

WeijianQi1999

updated a Space 25 days ago

Online-Mind2Web Leaderboard

Display and analyze evaluation data for agents

lzy337

authored 4 papers 27 days ago

ChatCounselor: A Large Language Models for Mental Health Support

Paper • 2309.15461 • Published Sep 27, 2023

In Search of the Long-Tail: Systematic Generation of Long-Tail Knowledge via Logical Rule Guided Search

Paper • 2311.07237 • Published Nov 13, 2023

A Trembling House of Cards? Mapping Adversarial Attacks against Language Agents

Paper • 2402.10196 • Published Feb 15, 2024

AttributionBench: How Hard is Automatic Attribution Evaluation?

Paper • 2402.15089 • Published Feb 23, 2024