3 1 28

Vaidik

VaidikML0508

AI & ML interests

exploring another way to use gradient decent

Recent Activity

liked a model 16 days ago

maya-research/Veena

liked a model about 1 month ago

sarvamai/sarvam-m

liked a model about 1 month ago

bharatgenai/patram-7b-instruct

View all activity

Organizations

None yet

Collections 2

models 15

datasets 2

VaidikML0508/SharkTank-Offer-V1

Viewer • Updated Mar 18 • 255 • 23

VaidikML0508/SharkTank-Offer-DPO-dataset-V1

Viewer • Updated Mar 18 • 263 • 17 • 1

Vaidik

AI & ML interests

Recent Activity

Organizations

Collections 2

VaidikML0508/Shark-Tank-Offer-Evaluator-llama3.2-3B-Instruct-GRPO-16bits-V1

VaidikML0508/Shark-Tank-Offer-Evaluator-llama3.2-3B-Instruct-SFT-DPO-4bits-V1

VaidikML0508/SharkTank-Offer-V1

VaidikML0508/SharkTank-Offer-DPO-dataset-V1

Self-GRIT/PILE_Wikipedia_Pretraining_subset_100k-distill

SharedBailii/bailii-pretraining-order

VaidikML0508/Shark-Tank-Offer-Evaluator-llama3.2-3B-Instruct-GRPO-16bits-V1

VaidikML0508/Shark-Tank-Offer-Evaluator-llama3.2-3B-Instruct-SFT-DPO-4bits-V1

VaidikML0508/SharkTank-Offer-V1

VaidikML0508/SharkTank-Offer-DPO-dataset-V1

Self-GRIT/PILE_Wikipedia_Pretraining_subset_100k-distill

SharedBailii/bailii-pretraining-order

models 15

VaidikML0508/Shark-Tank-Offer-Evaluator-llama3.2-3B-Instruct-GRPO-16bits-V1

VaidikML0508/Shark-Tank-Offer-Evaluator-llama3.2-3B-Instruct-SFT-DPO-4bits-V1

VaidikML0508/rl_course_vizdoom_health_gathering_supreme

VaidikML0508/Reinforce-pixel-copte-1

VaidikML0508/Reinforce-pixel-copter

VaidikML0508/a2c-PandaReachDense-v3

VaidikML0508/ML-Agents-Pyramids

VaidikML0508/ppo-LunarLander-v2

VaidikML0508/taxi-V3

VaidikML0508/q-FrozenLake-v1-4x4-noSlippery

datasets 2

VaidikML0508/SharkTank-Offer-V1

VaidikML0508/SharkTank-Offer-DPO-dataset-V1

Vaidik

AI & ML interests

Recent Activity

Organizations

Collections 2

models 15 Sort: Recently updated

datasets 2 Sort: Recently updated

models 15

datasets 2