kg_llm_leaderboard_test

Runtime error

App Files Files Community

b1sheng commited on Jul 27, 2023

Commit

cc33ff8

1 Parent(s): ee6bd36

Update app.py

Browse files

Files changed (1) hide show

app.py +6 -30

app.py CHANGED Viewed

@@ -1,29 +1,13 @@
-import json
-import os
-from datetime import datetime, timezone
 import gradio as gr
-import numpy as np
 import pandas as pd
-from apscheduler.schedulers.background import BackgroundScheduler
-from huggingface_hub import HfApi
-from transformers import AutoConfig
-from src.auto_leaderboard.get_model_metadata import apply_metadata
 from src.assets.text_content import *
-from src.auto_leaderboard.load_results import get_eval_results_dicts, make_clickable_model
-from src.assets.hardcoded_evals import gpt4_values, gpt35_values, baseline
-from src.assets.css_html_js import custom_css, get_window_url_params
-from src.utils_display import AutoEvalColumn, EvalQueueColumn, fields, styled_error, styled_warning, styled_message
-from src.init import get_all_requested_models, load_all_info_from_hub
 def get_leaderboard_df():
     data = {
-        'Datasets': ['metrics','SOTA(FT)', 'SOTA(ZS)', 'FLAN-T5', 'GPT-3', 'GPT-3.5v2', 'GPT-3.5v3', 'ChatGPT', 'GPT-4'],
         'KQApro': ['Acc','93.85', '94.20', '37.27', '38.28', '38.01', '40.35', '47.93', '57.20'],
         'LC-quad2': ['F1','33.10', '-', '30.14', '33.04', '33.77', '39.04', '42.76', '54.95'],
         'WQSP': ['Acc','73.10', '62.98', '59.87', '67.68', '72.34', '79.60', '83.70', '90.45'],
@@ -38,16 +22,13 @@ def get_leaderboard_df():
     return df
-original_df = get_leaderboard_df()
-leaderboard_df = original_df.copy()
 def search_table(df, query):
-    if query == "":
-        return df
-    else:
-        return df[df.apply(lambda row: query.lower() in row.astype(str).lower(), axis=1).any()]
 demo = gr.Blocks(css=custom_css)
 with demo:
     gr.HTML(TITLE)
@@ -61,7 +42,6 @@ with demo:
             )
     with gr.Tabs(elem_classes="tab-buttons") as tabs:
         with gr.TabItem("🏅 LLM Benchmark", elem_id="llm-benchmark-tab-table", id=1):
             leaderboard_table = gr.components.Dataframe(
                 value=leaderboard_df,
@@ -83,8 +63,6 @@ with demo:
         with gr.TabItem("About", elem_id="llm-benchmark-tab-table", id=2):
             gr.Markdown(LLM_BENCHMARKS_TEXT, elem_classes="markdown-text")
     with gr.Row():
         with gr.Accordion("📙 Citation", open=False):
             citation_button = gr.Textbox(
@@ -93,6 +71,4 @@ with demo:
                 elem_id="citation-button",
             ).style(show_copy_button=True)
 demo.queue(concurrency_count=40).launch()

 import gradio as gr
 import pandas as pd
 from src.assets.text_content import *
+from src.assets.css_html_js import custom_css
 def get_leaderboard_df():
     data = {
+        'Datasets': ['metrics','SOTA(FT)', 'SOTA(ZS)', 'FLAN-T5-XXL', 'text-davinci-001', 'text-davinci-002', 'text-davinci-003', 'ChatGPT', 'GPT-4'],
         'KQApro': ['Acc','93.85', '94.20', '37.27', '38.28', '38.01', '40.35', '47.93', '57.20'],
         'LC-quad2': ['F1','33.10', '-', '30.14', '33.04', '33.77', '39.04', '42.76', '54.95'],
         'WQSP': ['Acc','73.10', '62.98', '59.87', '67.68', '72.34', '79.60', '83.70', '90.45'],
     return df
 def search_table(df, query):
+    return df[df.apply(lambda row: row.astype(str).str.contains(query).any(), axis=1)]
+original_df = get_leaderboard_df()
+leaderboard_df = original_df.copy()
 demo = gr.Blocks(css=custom_css)
 with demo:
     gr.HTML(TITLE)
             )
     with gr.Tabs(elem_classes="tab-buttons") as tabs:
         with gr.TabItem("🏅 LLM Benchmark", elem_id="llm-benchmark-tab-table", id=1):
             leaderboard_table = gr.components.Dataframe(
                 value=leaderboard_df,
         with gr.TabItem("About", elem_id="llm-benchmark-tab-table", id=2):
             gr.Markdown(LLM_BENCHMARKS_TEXT, elem_classes="markdown-text")
     with gr.Row():
         with gr.Accordion("📙 Citation", open=False):
             citation_button = gr.Textbox(
                 elem_id="citation-button",
             ).style(show_copy_button=True)
 demo.queue(concurrency_count=40).launch()