Spaces:

achterbrain
/

Intel-Generative-Image-Dashboard

Runtime error

App Files Files Community

achterbrain commited on Dec 21, 2022

Commit

54b89ad

1 Parent(s): 982eb46

added from experimental: continued manual rating, table data preview, pre rating visualisation

Browse files

Files changed (2) hide show

pages/1_⚙️Manual assessment.py +48 -0
pages/3_📊Assessment summary.py +72 -25

pages/1_⚙️Manual assessment.py CHANGED Viewed

@@ -3,12 +3,52 @@ import numpy as np
 import pandas as pd
 from PIL import Image
 st.title('Manual assessment')
 st.write('On this page you can rate all uploaded images with regards to how good they match their respective prompts. You can see the outcome of your assessment on the summary page.')
 st.write(' ')
 side_image = Image.open('Graphics/IL_Logo.png')
 st.sidebar.image(side_image)
 # Create placeholders for key elements
 assessment_progress = st.empty()
 # Extract how many images are available for manual assessment in entire uploaded dataset
@@ -30,12 +70,14 @@ except KeyError:
 ## If subprompt option is selected, it expands the form to include these as well
 ## If no images are available it prints situation specific instructions
 if manual_eval_available > 0:
     # Let user choose whether subprompts should be presented
     include_subprompts = st.checkbox('Show related subprompts if available (uploaded subprompts may not be shown if images have been assessed already).', value=True)
     # Update the progress statement
     assessment_progress.write('{0} images ready / left for assessment.'.format(manual_eval_available))
     # Extract first example for manual assessment which is not rated yet (first meaning the lowest index, for lowest prompt number)
     ## Also extract relevant metadata of this example
     curr_eval_df = st.session_state['eval_df']
@@ -129,6 +171,9 @@ if manual_eval_available > 0:
             # Reset page after ratings were submitted
             st.experimental_rerun()
 # If no files are uploaded
 elif len(st.session_state['uploaded_img'])==0:
     assessment_progress.write('Upload files on dashboard starting page to start manual assessment.')
@@ -140,3 +185,6 @@ else:
 #st.session_state['eval_df'].loc[curr_manual_eval,'manual_eval_completed']=True
 #st.write(st.session_state['eval_df'])

 import pandas as pd
 from PIL import Image
+def add_previous_manual_assessments():
+    '''
+    This is a routine to allow the user to upload prior manual ratings and override
+    current ratings. This way the user can restart a manual assessment.
+    '''
+    # Create dict to translate uploaded score into str format used during manual assessment
+    Bool_str_dict = {True:'Yes',False:'No'}
+    st.subheader('Add previous assessments')
+    st.write('Upload results of previous assessment (as downloaded from summary page) to add these results and skip these images in your current manual assessment. Note that you can only add results for images which you have uploaded using the same file name.')
+    uploaded_ratings = st.file_uploader('Select .csv for upload', accept_multiple_files=False)
+    if uploaded_ratings != None:
+        try:
+            uploaded_ratings_df = pd.read_csv(uploaded_ratings)
+            overlapping_files_df =pd.merge(st.session_state['eval_df'],uploaded_ratings_df,on='File_name',how='inner')
+            st.write('Number of matching file names found: '+ str(len(overlapping_files_df)))
+            st.write('Click "Add results" button to add / override current ratings with uploaded ratings.')
+        except UnicodeDecodeError:
+            st.write('WARNING: The uploaded file has to be a .csv downloaded from the "Assessment summary" page.')
+    submitted = st.button("Add results")
+    if submitted:
+        try:
+            for row in uploaded_ratings_df.itertuples():
+                st.session_state['eval_df'].loc[
+                    st.session_state['eval_df']['File_name']==row.File_name,'manual_eval']=True
+                st.session_state['eval_df'].loc[
+                    st.session_state['eval_df']['File_name']==row.File_name,'manual_eval_completed']=True
+                st.session_state['eval_df'].loc[
+                    st.session_state['eval_df']['File_name']==row.File_name,'manual_eval_task_score']=Bool_str_dict[row.Score]
+            # Reset page after ratings were submitted
+            st.experimental_rerun()
+        except NameError:
+            st.write('You need to upload a .csv file before you can add results.')
 st.title('Manual assessment')
 st.write('On this page you can rate all uploaded images with regards to how good they match their respective prompts. You can see the outcome of your assessment on the summary page.')
 st.write(' ')
 side_image = Image.open('Graphics/IL_Logo.png')
 st.sidebar.image(side_image)
 # Create placeholders for key elements
+assessment_header = st.empty()
 assessment_progress = st.empty()
 # Extract how many images are available for manual assessment in entire uploaded dataset
 ## If subprompt option is selected, it expands the form to include these as well
 ## If no images are available it prints situation specific instructions
 if manual_eval_available > 0:
+    assessment_header.subheader('Assess uploaded images')
     # Let user choose whether subprompts should be presented
     include_subprompts = st.checkbox('Show related subprompts if available (uploaded subprompts may not be shown if images have been assessed already).', value=True)
     # Update the progress statement
     assessment_progress.write('{0} images ready / left for assessment.'.format(manual_eval_available))
     # Extract first example for manual assessment which is not rated yet (first meaning the lowest index, for lowest prompt number)
     ## Also extract relevant metadata of this example
     curr_eval_df = st.session_state['eval_df']
             # Reset page after ratings were submitted
             st.experimental_rerun()
+    add_previous_manual_assessments()
 # If no files are uploaded
 elif len(st.session_state['uploaded_img'])==0:
     assessment_progress.write('Upload files on dashboard starting page to start manual assessment.')
 #st.session_state['eval_df'].loc[curr_manual_eval,'manual_eval_completed']=True
 #st.write(st.session_state['eval_df'])

pages/3_📊Assessment summary.py CHANGED Viewed

@@ -11,11 +11,21 @@ def convert_df_to_csv(df):
   # IMPORTANT: Cache the conversion to prevent computation on every rerun
   return df[['File_name','Prompt_no','Task','Score']].to_csv().encode('utf-8')
-def plot_style_simple(results_df):
   eval_sum = results_df.groupby('Task')['Score'].sum()
   eval_count = results_df.groupby('Task')['Score'].count()
   eval_share = (eval_sum/eval_count)*100
   fig = plt.figure(figsize=(12, 3))
   sns.barplot(x=eval_share.index, y=eval_share.values, palette='GnBu')
   plt.xticks(rotation=-45)
@@ -23,9 +33,9 @@ def plot_style_simple(results_df):
   plt.xlabel(' ')
   return fig
-def plot_style_combined(results_df, uploaded_df = None):
   # Create joined dataframe of results and uploadd_df
-  uploaded_results_df = pd.read_csv(uploaded_df)
   manual_results_df['Model']='Current'
   uploaded_results_df['Model']='Uploaded'
   results_df = pd.concat([manual_results_df,uploaded_results_df])
@@ -36,6 +46,14 @@ def plot_style_combined(results_df, uploaded_df = None):
   eval_share = (eval_sum/eval_count)*100
   eval_share = eval_share.reset_index()
   # Create plot
   fig = plt.figure(figsize=(12, 3))
   sns.barplot(data=eval_share,x='Task',y='Score',hue='Model', palette='GnBu')
@@ -44,20 +62,49 @@ def plot_style_combined(results_df, uploaded_df = None):
   plt.xlabel(' ')
   return fig
-assessment_result_frames = {}
-st.title('Assessment Summary')
-st.header('Manual assessment')
 try:
   if sum(st.session_state['eval_df']['manual_eval_completed'])>0:
     # Display file uploader
     manual_file_upload = st.file_uploader("Upload .csv with saved manual assessment for model comparison")
     # Create dataset for manual summary plots
     manual_eval_df = st.session_state['eval_df']
     manual_eval_df['Score'] = manual_eval_df['manual_eval_task_score'].map({'Yes':True, 'No':False})
@@ -67,13 +114,12 @@ try:
     assessment_result_frames['Manual assessment'] = manual_results_df
-    # If df was uploaded for comparison, we create comparison plot, else simple plot
-    if manual_file_upload == None:
-      fig = plot_style_simple(manual_results_df)
-      st.pyplot(fig)
-    else:
-      fig = plot_style_combined(manual_results_df,manual_file_upload)
-      st.pyplot(fig)
     st.download_button(
       label="Download manual assessment data",
@@ -82,9 +128,12 @@ try:
       mime='text/csv',
     )
   else:
-    st.write('Complete manual assessment to generate summary.')
 except KeyError:
-  st.write('Complete automated assessment to generate summary.')
 st.write(' ')
@@ -97,14 +146,12 @@ try:
   # Display file uploader
   auto_file_upload = st.file_uploader("Upload .csv with saved automated assessment for model comparison")
-  # If df was uploaded for comparison, we create comparison plot, else simple plot
-  if auto_file_upload == None:
-    fig = plot_style_simple(auto_eval_df)
-    st.pyplot(fig)
-  else:
-    fig = plot_style_combined(auto_eval_df,auto_file_upload)
-    st.pyplot(fig)
   st.download_button(
     label="Download automated assessment data",
@@ -113,7 +160,7 @@ try:
     mime='text/csv',
   )
 except KeyError:
-  st.write('Complete automated assessment to generate summary.')
 try:

   # IMPORTANT: Cache the conversion to prevent computation on every rerun
   return df[['File_name','Prompt_no','Task','Score']].to_csv().encode('utf-8')
+def plot_style_simple(results_df, return_table = False):
   eval_sum = results_df.groupby('Task')['Score'].sum()
   eval_count = results_df.groupby('Task')['Score'].count()
   eval_share = (eval_sum/eval_count)*100
+  if return_table:
+    return_series = results_df.groupby('Task')['Score'].sum()/results_df.groupby('Task')['Score'].count()*100
+    return_series = return_series.rename('Percentage correct')
+    return return_series
+  # Add small amount to make the bars on plot not disappear
+  eval_share = eval_share+1
   fig = plt.figure(figsize=(12, 3))
   sns.barplot(x=eval_share.index, y=eval_share.values, palette='GnBu')
   plt.xticks(rotation=-45)
   plt.xlabel(' ')
   return fig
+def plot_style_combined(results_df, uploaded_df = None, return_table=False):
   # Create joined dataframe of results and uploadd_df
+  uploaded_results_df = uploaded_df
   manual_results_df['Model']='Current'
   uploaded_results_df['Model']='Uploaded'
   results_df = pd.concat([manual_results_df,uploaded_results_df])
   eval_share = (eval_sum/eval_count)*100
   eval_share = eval_share.reset_index()
+  if return_table:
+    return_series = results_df.groupby(['Task','Model'])['Score'].sum()/results_df.groupby(['Task','Model'])['Score'].count()*100
+    return_series = return_series.rename('Percentage correct')
+    return return_series
+  # Add small amount to make the bars on plot not disappear
+  eval_share['Score'] = eval_share['Score']+1
   # Create plot
   fig = plt.figure(figsize=(12, 3))
   sns.barplot(data=eval_share,x='Task',y='Score',hue='Model', palette='GnBu')
   plt.xlabel(' ')
   return fig
+def print_results_tabs(file_upload, results_df, file_upload_df=None):
+  # Create a tab for bar chart and one for table data
+  tab1, tab2 = st.tabs(["Bar chart", "Data table"])
+  with tab1:
+    # If df was uploaded for comparison, we create comparison plot, else simple plot
+    if file_upload == None:
+      fig = plot_style_simple(results_df)
+      st.pyplot(fig)
+    else:
+      fig = plot_style_combined(results_df,file_upload_df)
+      st.pyplot(fig)
+  with tab2:
+    # If df was uploaded for comparison, we create comparison table, else simple table
+    if file_upload == None:
+      table = plot_style_simple(results_df, return_table=True)
+      st.write(table)
+    else:
+      table = plot_style_combined(results_df,file_upload_df, return_table=True)
+      st.write(table)
+def pre_assessment_visualisation(type_str):
+  st.write('Complete {0} assessment or upload .csv with saved {0} assessment to generate summary.'.format(type_str))
+  # Display file uploader
+  file_upload = st.file_uploader("Upload .csv with saved {0} assessment to plot prior results.".format(type_str))
+  if file_upload != None:
+    file_upload_df = pd.read_csv(file_upload).copy()
+    print_results_tabs(file_upload=None, results_df=file_upload_df)
+assessment_result_frames = {}
+st.title('Assessment Summary')
+st.header('Manual assessment')
 try:
   if sum(st.session_state['eval_df']['manual_eval_completed'])>0:
     # Display file uploader
     manual_file_upload = st.file_uploader("Upload .csv with saved manual assessment for model comparison")
     # Create dataset for manual summary plots
     manual_eval_df = st.session_state['eval_df']
     manual_eval_df['Score'] = manual_eval_df['manual_eval_task_score'].map({'Yes':True, 'No':False})
     assessment_result_frames['Manual assessment'] = manual_results_df
+    # Add plots / tables to page
+    try:
+      manual_file_upload_df = pd.read_csv(manual_file_upload).copy()
+      print_results_tabs(file_upload=manual_file_upload, results_df=manual_results_df, file_upload_df=manual_file_upload_df)
+    except ValueError:
+      print_results_tabs(file_upload=manual_file_upload, results_df=manual_results_df)
     st.download_button(
       label="Download manual assessment data",
       mime='text/csv',
     )
   else:
+    pre_assessment_visualisation(type_str='manual')
 except KeyError:
+  pre_assessment_visualisation(type_str='manual')
 st.write(' ')
   # Display file uploader
   auto_file_upload = st.file_uploader("Upload .csv with saved automated assessment for model comparison")
+  # Add plots / tables to page
+  try:
+    auto_file_upload_df = pd.read_csv(auto_file_upload).copy()
+    print_results_tabs(file_upload=auto_file_upload, results_df=auto_eval_df, file_upload_df=auto_file_upload_df)
+  except ValueError:
+    print_results_tabs(file_upload=auto_file_upload, results_df=auto_eval_df)
   st.download_button(
     label="Download automated assessment data",
     mime='text/csv',
   )
 except KeyError:
+  pre_assessment_visualisation(type_str='automated')
 try: