Upload 6 files

Browse files

Files changed (6) hide show

mldr/models/__init__.py +10 -0
mldr/models/default.py +4 -0
mldr/models/retrieva.py +13 -0
mldr/models/retrieva_en.py +15 -0
mldr/mteb_eval.py +43 -0
mldr/results/MultiLongDocRetrieval.json +307 -0

mldr/models/__init__.py ADDED Viewed

	@@ -0,0 +1,10 @@

+from .default import PROMPT as default_prompt
+from .retrieva import PROMPT as retrieva_prompt
+from .retrieva_en import PROMPT as retrieva_en_prompt
+PROMPTS = {
+    "default": default_prompt,
+    "retrieva": retrieva_prompt,
+    "retrieva-en": retrieva_en_prompt,
+}

mldr/models/default.py ADDED Viewed

	@@ -0,0 +1,4 @@

+PROMPT = {
+    "query": "query: ",
+    "passage": "passage: ",
+}

mldr/models/retrieva.py ADDED Viewed

	@@ -0,0 +1,13 @@

+PROMPT = {
+    "STS": "同じ意味の文を探すために次の文を表現して\n",
+    "Summarization": "次の記事またはタイトルを表現して\n",
+    "BitextMining": "次の文を表現して\n",
+    "Classification": "同じクラスに属する文を探すために次の文を表現して\n",
+    "Clustering": "類似した文を探すために次の文を表現して\n",
+    "Reranking-query": "関連した文書を探すために次の文を表現して\n",
+    "Reranking-passage": "次の文章を表現して\n",
+    "Retrieval-query": "関連した文書を探すために次の文を表現して\n",
+    "Retrieval-passage": "次の文章を表現して\n",
+    "InstructionRetrieval": "",
+    "PairClassification": "同じ意味の文を探すために次の文を表現して\n",
+}

mldr/models/retrieva_en.py ADDED Viewed

	@@ -0,0 +1,15 @@

+PROMPT = {
+    "STS": "Represent the sentence for retrieving duplicate sentences:\n",
+    "Summarization": "Represent the news article or news title for retrieval:\n",
+    "BitextMining": "Represent the sentence\n",
+    "Classification": "Represent the sentence for retrieving the sentence belonging to the same category:\n",
+    "Clustering": "Represent the sentence to find similar sentences:\n",
+    "Reranking-query": "Represent the question:\n",
+    "Reranking-passage": "Represent the following text:\n",
+    "Retrieval-query": "Represent the question:\n",
+    "Retrieval-passage": "Represent the following text:\n",
+    "InstructionRetrieval": "Retrieve text based on user query:\n",
+    "PairClassification": "Represent the sentence for retrieving duplicate sentences:\n",
+    "MultilabelClassification": "Represent the sentence for retrieving the sentence belonging to the same category:\n",
+    "Speed": "",
+}

mldr/mteb_eval.py ADDED Viewed

	@@ -0,0 +1,43 @@

+"""Evaluate AMBER models"""
+import argparse
+import mteb
+from models import PROMPTS
+def get_args() -> argparse.Namespace:
+    parser = argparse.ArgumentParser()
+    parser.add_argument("--model_type", type=str, required=True, help="Model name", choices=PROMPTS.keys())
+    parser.add_argument("--model_name_or_path", type=str, required=True)
+    parser.add_argument("--batch_size", type=int, default=32, help="Batch size")
+    parser.add_argument("--output_dir", type=str, required=True, help="Output directory")
+    parser.add_argument("--corpus_chunk_size", type=int, default=50000)
+    parser.add_argument("--convert_to_tensor", action="store_true")
+    return parser.parse_args()
+def main():
+    args = get_args()
+    prompt = PROMPTS[args.model_type]
+    model = mteb.get_model(args.model_name_or_path, model_prompts=prompt)
+    tasks = [mteb.get_task("MultiLongDocRetrieval", languages=["jpn"])]
+    evaluation = mteb.MTEB(tasks=tasks)
+    encode_kwargs = {
+        "batch_size": args.batch_size,
+        "convert_to_tensor": args.convert_to_tensor,
+    }
+    evaluation.run(
+        model,
+        output_folder=args.output_dir,
+        encode_kwargs=encode_kwargs,
+        corpus_chunk_size=args.corpus_chunk_size,
+    )
+if __name__ == "__main__":
+    main()

mldr/results/MultiLongDocRetrieval.json ADDED Viewed

	@@ -0,0 +1,307 @@

+{
+  "dataset_revision": "d67138e705d963e346253a80e59676ddb418810a",
+  "task_name": "MultiLongDocRetrieval",
+  "mteb_version": "1.36.1",
+  "scores": {
+    "dev": [
+      {
+        "ndcg_at_1": 0.29,
+        "ndcg_at_3": 0.35547,
+        "ndcg_at_5": 0.36193,
+        "ndcg_at_10": 0.37975,
+        "ndcg_at_20": 0.39722,
+        "ndcg_at_100": 0.42003,
+        "ndcg_at_1000": 0.4448,
+        "map_at_1": 0.29,
+        "map_at_3": 0.34,
+        "map_at_5": 0.34375,
+        "map_at_10": 0.35114,
+        "map_at_20": 0.3558,
+        "map_at_100": 0.35884,
+        "map_at_1000": 0.35967,
+        "recall_at_1": 0.29,
+        "recall_at_3": 0.4,
+        "recall_at_5": 0.415,
+        "recall_at_10": 0.47,
+        "recall_at_20": 0.54,
+        "recall_at_100": 0.665,
+        "recall_at_1000": 0.865,
+        "precision_at_1": 0.29,
+        "precision_at_3": 0.13333,
+        "precision_at_5": 0.083,
+        "precision_at_10": 0.047,
+        "precision_at_20": 0.027,
+        "precision_at_100": 0.00665,
+        "precision_at_1000": 0.00087,
+        "mrr_at_1": 0.29,
+        "mrr_at_3": 0.34,
+        "mrr_at_5": 0.34375,
+        "mrr_at_10": 0.351137,
+        "mrr_at_20": 0.355805,
+        "mrr_at_100": 0.358836,
+        "mrr_at_1000": 0.359674,
+        "nauc_ndcg_at_1_max": 0.505659,
+        "nauc_ndcg_at_1_std": 0.015906,
+        "nauc_ndcg_at_1_diff1": 0.596287,
+        "nauc_ndcg_at_3_max": 0.533264,
+        "nauc_ndcg_at_3_std": 0.032754,
+        "nauc_ndcg_at_3_diff1": 0.586672,
+        "nauc_ndcg_at_5_max": 0.531308,
+        "nauc_ndcg_at_5_std": 0.036854,
+        "nauc_ndcg_at_5_diff1": 0.586102,
+        "nauc_ndcg_at_10_max": 0.531042,
+        "nauc_ndcg_at_10_std": 0.061878,
+        "nauc_ndcg_at_10_diff1": 0.566107,
+        "nauc_ndcg_at_20_max": 0.539226,
+        "nauc_ndcg_at_20_std": 0.067577,
+        "nauc_ndcg_at_20_diff1": 0.554971,
+        "nauc_ndcg_at_100_max": 0.536018,
+        "nauc_ndcg_at_100_std": 0.071992,
+        "nauc_ndcg_at_100_diff1": 0.531947,
+        "nauc_ndcg_at_1000_max": 0.542956,
+        "nauc_ndcg_at_1000_std": 0.088587,
+        "nauc_ndcg_at_1000_diff1": 0.547443,
+        "nauc_map_at_1_max": 0.505659,
+        "nauc_map_at_1_std": 0.015906,
+        "nauc_map_at_1_diff1": 0.596287,
+        "nauc_map_at_3_max": 0.529127,
+        "nauc_map_at_3_std": 0.027918,
+        "nauc_map_at_3_diff1": 0.588492,
+        "nauc_map_at_5_max": 0.527978,
+        "nauc_map_at_5_std": 0.030311,
+        "nauc_map_at_5_diff1": 0.58816,
+        "nauc_map_at_10_max": 0.527822,
+        "nauc_map_at_10_std": 0.041362,
+        "nauc_map_at_10_diff1": 0.579864,
+        "nauc_map_at_20_max": 0.530149,
+        "nauc_map_at_20_std": 0.042933,
+        "nauc_map_at_20_diff1": 0.576511,
+        "nauc_map_at_100_max": 0.530358,
+        "nauc_map_at_100_std": 0.044082,
+        "nauc_map_at_100_diff1": 0.57324,
+        "nauc_map_at_1000_max": 0.530766,
+        "nauc_map_at_1000_std": 0.045058,
+        "nauc_map_at_1000_diff1": 0.57385,
+        "nauc_recall_at_1_max": 0.505659,
+        "nauc_recall_at_1_std": 0.015906,
+        "nauc_recall_at_1_diff1": 0.596287,
+        "nauc_recall_at_3_max": 0.543872,
+        "nauc_recall_at_3_std": 0.046595,
+        "nauc_recall_at_3_diff1": 0.581771,
+        "nauc_recall_at_5_max": 0.539487,
+        "nauc_recall_at_5_std": 0.055974,
+        "nauc_recall_at_5_diff1": 0.580452,
+        "nauc_recall_at_10_max": 0.538971,
+        "nauc_recall_at_10_std": 0.129465,
+        "nauc_recall_at_10_diff1": 0.519139,
+        "nauc_recall_at_20_max": 0.572192,
+        "nauc_recall_at_20_std": 0.155817,
+        "nauc_recall_at_20_diff1": 0.47407,
+        "nauc_recall_at_100_max": 0.547704,
+        "nauc_recall_at_100_std": 0.193272,
+        "nauc_recall_at_100_diff1": 0.311819,
+        "nauc_recall_at_1000_max": 0.666392,
+        "nauc_recall_at_1000_std": 0.580073,
+        "nauc_recall_at_1000_diff1": 0.351308,
+        "nauc_precision_at_1_max": 0.505659,
+        "nauc_precision_at_1_std": 0.015906,
+        "nauc_precision_at_1_diff1": 0.596287,
+        "nauc_precision_at_3_max": 0.543872,
+        "nauc_precision_at_3_std": 0.046595,
+        "nauc_precision_at_3_diff1": 0.581771,
+        "nauc_precision_at_5_max": 0.539487,
+        "nauc_precision_at_5_std": 0.055974,
+        "nauc_precision_at_5_diff1": 0.580452,
+        "nauc_precision_at_10_max": 0.538971,
+        "nauc_precision_at_10_std": 0.129465,
+        "nauc_precision_at_10_diff1": 0.519139,
+        "nauc_precision_at_20_max": 0.572192,
+        "nauc_precision_at_20_std": 0.155817,
+        "nauc_precision_at_20_diff1": 0.47407,
+        "nauc_precision_at_100_max": 0.547704,
+        "nauc_precision_at_100_std": 0.193272,
+        "nauc_precision_at_100_diff1": 0.311819,
+        "nauc_precision_at_1000_max": 0.666392,
+        "nauc_precision_at_1000_std": 0.580073,
+        "nauc_precision_at_1000_diff1": 0.351308,
+        "nauc_mrr_at_1_max": 0.505659,
+        "nauc_mrr_at_1_std": 0.015906,
+        "nauc_mrr_at_1_diff1": 0.596287,
+        "nauc_mrr_at_3_max": 0.529127,
+        "nauc_mrr_at_3_std": 0.027918,
+        "nauc_mrr_at_3_diff1": 0.588492,
+        "nauc_mrr_at_5_max": 0.527978,
+        "nauc_mrr_at_5_std": 0.030311,
+        "nauc_mrr_at_5_diff1": 0.58816,
+        "nauc_mrr_at_10_max": 0.527822,
+        "nauc_mrr_at_10_std": 0.041362,
+        "nauc_mrr_at_10_diff1": 0.579864,
+        "nauc_mrr_at_20_max": 0.530149,
+        "nauc_mrr_at_20_std": 0.042933,
+        "nauc_mrr_at_20_diff1": 0.576511,
+        "nauc_mrr_at_100_max": 0.530358,
+        "nauc_mrr_at_100_std": 0.044082,
+        "nauc_mrr_at_100_diff1": 0.57324,
+        "nauc_mrr_at_1000_max": 0.530766,
+        "nauc_mrr_at_1000_std": 0.045058,
+        "nauc_mrr_at_1000_diff1": 0.57385,
+        "main_score": 0.37975,
+        "hf_subset": "ja",
+        "languages": [
+          "jpn-Jpan"
+        ]
+      }
+    ],
+    "test": [
+      {
+        "ndcg_at_1": 0.245,
+        "ndcg_at_3": 0.30928,
+        "ndcg_at_5": 0.33166,
+        "ndcg_at_10": 0.34569,
+        "ndcg_at_20": 0.35817,
+        "ndcg_at_100": 0.38436,
+        "ndcg_at_1000": 0.40594,
+        "map_at_1": 0.245,
+        "map_at_3": 0.295,
+        "map_at_5": 0.30725,
+        "map_at_10": 0.31275,
+        "map_at_20": 0.31608,
+        "map_at_100": 0.31973,
+        "map_at_1000": 0.32053,
+        "recall_at_1": 0.245,
+        "recall_at_3": 0.35,
+        "recall_at_5": 0.405,
+        "recall_at_10": 0.45,
+        "recall_at_20": 0.5,
+        "recall_at_100": 0.64,
+        "recall_at_1000": 0.81,
+        "precision_at_1": 0.245,
+        "precision_at_3": 0.11667,
+        "precision_at_5": 0.081,
+        "precision_at_10": 0.045,
+        "precision_at_20": 0.025,
+        "precision_at_100": 0.0064,
+        "precision_at_1000": 0.00081,
+        "mrr_at_1": 0.245,
+        "mrr_at_3": 0.295,
+        "mrr_at_5": 0.30725,
+        "mrr_at_10": 0.312748,
+        "mrr_at_20": 0.316079,
+        "mrr_at_100": 0.319726,
+        "mrr_at_1000": 0.320528,
+        "nauc_ndcg_at_1_max": 0.406893,
+        "nauc_ndcg_at_1_std": -0.009559,
+        "nauc_ndcg_at_1_diff1": 0.554901,
+        "nauc_ndcg_at_3_max": 0.444372,
+        "nauc_ndcg_at_3_std": -0.02926,
+        "nauc_ndcg_at_3_diff1": 0.509425,
+        "nauc_ndcg_at_5_max": 0.425091,
+        "nauc_ndcg_at_5_std": -0.031815,
+        "nauc_ndcg_at_5_diff1": 0.469611,
+        "nauc_ndcg_at_10_max": 0.447755,
+        "nauc_ndcg_at_10_std": -0.015871,
+        "nauc_ndcg_at_10_diff1": 0.462957,
+        "nauc_ndcg_at_20_max": 0.46053,
+        "nauc_ndcg_at_20_std": 0.005444,
+        "nauc_ndcg_at_20_diff1": 0.466256,
+        "nauc_ndcg_at_100_max": 0.461105,
+        "nauc_ndcg_at_100_std": 0.024618,
+        "nauc_ndcg_at_100_diff1": 0.453195,
+        "nauc_ndcg_at_1000_max": 0.465154,
+        "nauc_ndcg_at_1000_std": 0.038943,
+        "nauc_ndcg_at_1000_diff1": 0.448247,
+        "nauc_map_at_1_max": 0.406893,
+        "nauc_map_at_1_std": -0.009559,
+        "nauc_map_at_1_diff1": 0.554901,
+        "nauc_map_at_3_max": 0.435427,
+        "nauc_map_at_3_std": -0.025665,
+        "nauc_map_at_3_diff1": 0.517996,
+        "nauc_map_at_5_max": 0.424549,
+        "nauc_map_at_5_std": -0.027697,
+        "nauc_map_at_5_diff1": 0.495027,
+        "nauc_map_at_10_max": 0.433903,
+        "nauc_map_at_10_std": -0.021661,
+        "nauc_map_at_10_diff1": 0.492772,
+        "nauc_map_at_20_max": 0.437387,
+        "nauc_map_at_20_std": -0.015962,
+        "nauc_map_at_20_diff1": 0.493878,
+        "nauc_map_at_100_max": 0.437411,
+        "nauc_map_at_100_std": -0.013427,
+        "nauc_map_at_100_diff1": 0.49183,
+        "nauc_map_at_1000_max": 0.437574,
+        "nauc_map_at_1000_std": -0.012967,
+        "nauc_map_at_1000_diff1": 0.49167,
+        "nauc_recall_at_1_max": 0.406893,
+        "nauc_recall_at_1_std": -0.009559,
+        "nauc_recall_at_1_diff1": 0.554901,
+        "nauc_recall_at_3_max": 0.468877,
+        "nauc_recall_at_3_std": -0.038697,
+        "nauc_recall_at_3_diff1": 0.486789,
+        "nauc_recall_at_5_max": 0.424115,
+        "nauc_recall_at_5_std": -0.042187,
+        "nauc_recall_at_5_diff1": 0.397345,
+        "nauc_recall_at_10_max": 0.491711,
+        "nauc_recall_at_10_std": 0.008171,
+        "nauc_recall_at_10_diff1": 0.373993,
+        "nauc_recall_at_20_max": 0.541845,
+        "nauc_recall_at_20_std": 0.091805,
+        "nauc_recall_at_20_diff1": 0.383971,
+        "nauc_recall_at_100_max": 0.5606,
+        "nauc_recall_at_100_std": 0.225021,
+        "nauc_recall_at_100_diff1": 0.294953,
+        "nauc_recall_at_1000_max": 0.674171,
+        "nauc_recall_at_1000_std": 0.550841,
+        "nauc_recall_at_1000_diff1": 0.131908,
+        "nauc_precision_at_1_max": 0.406893,
+        "nauc_precision_at_1_std": -0.009559,
+        "nauc_precision_at_1_diff1": 0.554901,
+        "nauc_precision_at_3_max": 0.468877,
+        "nauc_precision_at_3_std": -0.038697,
+        "nauc_precision_at_3_diff1": 0.486789,
+        "nauc_precision_at_5_max": 0.424115,
+        "nauc_precision_at_5_std": -0.042187,
+        "nauc_precision_at_5_diff1": 0.397345,
+        "nauc_precision_at_10_max": 0.491711,
+        "nauc_precision_at_10_std": 0.008171,
+        "nauc_precision_at_10_diff1": 0.373993,
+        "nauc_precision_at_20_max": 0.541845,
+        "nauc_precision_at_20_std": 0.091805,
+        "nauc_precision_at_20_diff1": 0.383971,
+        "nauc_precision_at_100_max": 0.5606,
+        "nauc_precision_at_100_std": 0.225021,
+        "nauc_precision_at_100_diff1": 0.294953,
+        "nauc_precision_at_1000_max": 0.674171,
+        "nauc_precision_at_1000_std": 0.550841,
+        "nauc_precision_at_1000_diff1": 0.131908,
+        "nauc_mrr_at_1_max": 0.406893,
+        "nauc_mrr_at_1_std": -0.009559,
+        "nauc_mrr_at_1_diff1": 0.554901,
+        "nauc_mrr_at_3_max": 0.435427,
+        "nauc_mrr_at_3_std": -0.025665,
+        "nauc_mrr_at_3_diff1": 0.517996,
+        "nauc_mrr_at_5_max": 0.424549,
+        "nauc_mrr_at_5_std": -0.027697,
+        "nauc_mrr_at_5_diff1": 0.495027,
+        "nauc_mrr_at_10_max": 0.433903,
+        "nauc_mrr_at_10_std": -0.021661,
+        "nauc_mrr_at_10_diff1": 0.492772,
+        "nauc_mrr_at_20_max": 0.437387,
+        "nauc_mrr_at_20_std": -0.015962,
+        "nauc_mrr_at_20_diff1": 0.493878,
+        "nauc_mrr_at_100_max": 0.437411,
+        "nauc_mrr_at_100_std": -0.013427,
+        "nauc_mrr_at_100_diff1": 0.49183,
+        "nauc_mrr_at_1000_max": 0.437574,
+        "nauc_mrr_at_1000_std": -0.012967,
+        "nauc_mrr_at_1000_diff1": 0.49167,
+        "main_score": 0.34569,
+        "hf_subset": "ja",
+        "languages": [
+          "jpn-Jpan"
+        ]
+      }
+    ]
+  },
+  "evaluation_time": 297.0003197193146,
+  "kg_co2_emissions": null
+}