huggingface
diff --git a/‎community_tasks/aimo_evals.py
Lines changed: 1 addition & 1 deletion b/‎community_tasks/aimo_evals.py
Lines changed: 1 addition & 1 deletion
diff --git a/‎community_tasks/german_rag_evals.py
Lines changed: 4 additions & 4 deletions b/‎community_tasks/german_rag_evals.py
Lines changed: 4 additions & 4 deletions
diff --git a/‎community_tasks/oz_evals.py
Lines changed: 1 addition & 1 deletion b/‎community_tasks/oz_evals.py
Lines changed: 1 addition & 1 deletion
@@ -49,7 +49,7 @@ def aimo_prompt(line, task_name: str = None):
     evaluation_splits=["train"],
     few_shots_split="train",
     few_shots_select="sequential",
-    metric=[Metrics.quasi_exact_match_math],
+    metrics=[Metrics.quasi_exact_match_math],
     generation_size=2048,
     stop_sequence=None,
 )
 
@@ -162,7 +162,7 @@ def prompt_fn_context_question_match(line, task_name: str = None):
     evaluation_splits=["test"],
     few_shots_split="test",
     few_shots_select="sequential",
-    metric=[Metrics.loglikelihood_acc],
+    metrics=[Metrics.loglikelihood_acc],
     version=1,
 )
 
@@ -179,7 +179,7 @@ def prompt_fn_context_question_match(line, task_name: str = None):
     evaluation_splits=["test"],
     few_shots_split="test",
     few_shots_select="sequential",
-    metric=[Metrics.loglikelihood_acc],
+    metrics=[Metrics.loglikelihood_acc],
     version=1,
 )
 
@@ -197,7 +197,7 @@ def prompt_fn_context_question_match(line, task_name: str = None):
     evaluation_splits=["test"],
     few_shots_split="test",
     few_shots_select="sequential",
-    metric=[Metrics.loglikelihood_acc],
+    metrics=[Metrics.loglikelihood_acc],
     version=1,
 )
 
@@ -214,7 +214,7 @@ def prompt_fn_context_question_match(line, task_name: str = None):
     evaluation_splits=["test"],
     few_shots_split="test",
     few_shots_select="sequential",
-    metric=[Metrics.loglikelihood_acc],
+    metrics=[Metrics.loglikelihood_acc],
     version=1,
 )
 
 
@@ -78,7 +78,7 @@ def prompt_fn_oz_eval_task(line, task_name: str = None):
     evaluation_splits=["test"],
     few_shots_split=None,
     few_shots_select=None,
-    metric=[Metrics.loglikelihood_acc],
+    metrics=[Metrics.loglikelihood_acc],
     version=0,
 )
Original file line number	Diff line number	Diff line change
`@@ -49,7 +49,7 @@ def aimo_prompt(line, task_name: str = None):`
`49`	`49`	`evaluation_splits=["train"],`
`50`	`50`	`few_shots_split="train",`
`51`	`51`	`few_shots_select="sequential",`
`52`		`- metric=[Metrics.quasi_exact_match_math],`
	`52`	`+ metrics=[Metrics.quasi_exact_match_math],`
`53`	`53`	`generation_size=2048,`
`54`	`54`	`stop_sequence=None,`
`55`	`55`	`)`
Original file line number	Diff line number	Diff line change
`@@ -78,7 +78,7 @@ def prompt_fn_oz_eval_task(line, task_name: str = None):`
`78`	`78`	`evaluation_splits=["test"],`
`79`	`79`	`few_shots_split=None,`
`80`	`80`	`few_shots_select=None,`
`81`		`- metric=[Metrics.loglikelihood_acc],`
	`81`	`+ metrics=[Metrics.loglikelihood_acc],`
`82`	`82`	`version=0,`
`83`	`83`	`)`
`84`	`84`