Spaces:

AIML-TUDA
/

VerifiableRewardsForScalableLogicalReasoning

Running

Lukas Helff commited on 5 days ago

Commit

ac97ee4

1 Parent(s): 79ab7b5

update error message

Files changed (2) hide show

VerifiableRewardsForScalableLogicalReasoning.py CHANGED Viewed

@@ -115,7 +115,7 @@ def _evaluate_with_prolog(prediction, validation_program, eval_config, timeout=5
             "is_correct": False,
             "partial_score": 0.0,
             "syntax_valid": False,
-            "error": f"Invalid Syntax: Rule does not contain positive predicate '{positive_pred}'"
         }
     pos_examples = re.findall(rf'{positive_pred}\(([^)]+)\)', validation_program)
@@ -175,7 +175,7 @@ check_all :- forall((pos({vars});neg({vars})), check({vars})).
         is_correct = True if partial_score == 1.0 else False
-        error = f'Rule invalid "{rule_to_evaluate}" with' + result.stderr if result.stderr else None
         t1 = time.time()
         return {

             "is_correct": False,
             "partial_score": 0.0,
             "syntax_valid": False,
+            "error": f"Invalid Syntax: Logic Rule not found for symbol '{positive_pred}'"
         }
     pos_examples = re.findall(rf'{positive_pred}\(([^)]+)\)', validation_program)
         is_correct = True if partial_score == 1.0 else False
+        error = f'Rule invalid: "{rule_to_evaluate}" exit with ' + result.stderr if result.stderr else None
         t1 = time.time()
         return {

app.py CHANGED Viewed

@@ -39,7 +39,7 @@ def create_interface(module):
         if results["detailed_results"] and len(results["detailed_results"]) > 0:
             error = results["detailed_results"][0].get("error")
             if error:
-                error_msg = f"Error: {error}"
         return (
             f"Accuracy score: {results['accuracy']:.4f}",

         if results["detailed_results"] and len(results["detailed_results"]) > 0:
             error = results["detailed_results"][0].get("error")
             if error:
+                error_msg = error
         return (
             f"Accuracy score: {results['accuracy']:.4f}",