tuandunghcmut
/

vlm_clone_2

Model card Files Files and versions Community

vlm_clone_2 / VLMEvalKit /vlmeval /dataset /video_concat_dataset.py

tuandunghcmut

Add files using upload-large-folder tool

c85c9e5 verified 3 months ago

raw

history blame

3.3 kB

	from ..smp import *
	from .video_base import VideoBaseDataset


	class ConcatVideoDataset(VideoBaseDataset):
	# This dataset takes multiple dataset names as input and aggregate them into a single dataset.
	# Each single dataset should not have a field named `SUB_DATASET`

	DATASET_SETS = {}

	def __init__(self, dataset):
	from . import build_dataset
	datasets = self.DATASET_SETS[dataset]
	self.dataset_map = {}
	# The name of the compliation
	self.dataset_name = dataset
	self.datasets = datasets
	for dname in datasets:
	dataset = build_dataset(dname)
	assert dataset is not None, dataset
	self.dataset_map[dname] = dataset
	TYPES = [x.TYPE for x in self.dataset_map.values()]
	MODALITIES = [x.MODALITY for x in self.dataset_map.values()]
	# assert np.all([x == TYPES[0] for x in TYPES]), (datasets, TYPES)
	assert np.all([x == MODALITIES[0] for x in MODALITIES]), (datasets, MODALITIES)
	self.TYPE = TYPES
	self.MODALITY = MODALITIES[0]
	data_all = []
	for dname in datasets:
	data = self.dataset_map[dname].data
	data['SUB_DATASET'] = [dname] * len(data)
	data_all.append(data)

	data = pd.concat(data_all)
	data['original_index'] = data.pop('index')
	data['index'] = np.arange(len(data))
	self.data = data

	def build_prompt(self, line, num_frames, video_llm, fps):
	if isinstance(line, int):
	line = self.data.iloc[line]
	idx = line['original_index']
	dname = line['SUB_DATASET']
	org_data = self.dataset_map[dname].data
	org_line = cp.deepcopy(org_data[org_data['index'] == idx]).iloc[0]
	return self.dataset_map[dname].build_prompt(org_line, num_frames, video_llm, fps)

	def dump_image(self, line):
	# Assert all images are pre-dumped
	assert 'image' not in line
	assert 'image_path' in line
	tgt_path = toliststr(line['image_path'])
	return tgt_path

	@classmethod
	def supported_datasets(cls):
	return [] # list(cls.DATASET_SETS)

	def evaluate(self, eval_file, **judge_kwargs):
	suffix = eval_file.split('.')[-1]
	# First, split the eval_file by dataset
	data_all = load(eval_file)
	for dname in self.datasets:
	tgt = eval_file.replace(self.dataset_name, dname)
	data_sub = data_all[data_all['SUB_DATASET'] == dname]
	data_sub.pop('index')
	data_sub['index'] = data_sub.pop('original_index')
	data_sub.pop('SUB_DATASET')
	dump(data_sub, tgt)
	# Then, evaluate each dataset separately
	results_all = {}
	for dname in self.datasets:
	tgt = eval_file.replace(self.dataset_name, dname)
	res = self.dataset_map[dname].evaluate(tgt, **judge_kwargs)
	results_all.update(res)

	result = pd.DataFrame(results_all, index=['success', 'overall'])
	result = result.T
	for idx, item in result.iterrows():
	result.loc[idx, 'acc'] = round(item['success'] / item['overall'] * 100, 1)
	score_file = eval_file.replace(f'.{suffix}', '_acc.csv')
	dump(result, score_file)
	return result