Read our 2024 Summary blog post!

[[ visible ? '▲ HIDE' : '▼ SHOW BANNER' ]]

Quick search

Introduction
Installation
Loading Datasets
Evaluating Datasets
Use Cases
Guides ✨
Examples
Blog 📣
Code Documentation
📁 Catalog

📁 Criteria¶

📄 Adherence With Format
📄 Answer Completeness
📄 Answer Relevance
📄 Assistant Message Answer Relevance
📄 Assistant Message General Harm
📄 Assistant Message Groundedness
📄 Assistant Message Profanity
📄 Assistant Message Social Bias
📄 Assistant Message Unethical Behavior
📄 Assistant Message Violence
📄 Coherence
📄 Conciseness
📄 Consistency
📄 Context Context Relevance
📄 Conversational
📄 Correctness Based On Ground Truth
📄 Email Effectiveness
📄 Email Structure
📄 Empathy
📄 Engagement
📄 Examples And Details
📄 Fluency
📄 Grammar And Punctuation
📄 Harmfulness
📄 Information From Reference
📄 Information Outside Reference
📄 Insensitivity
📄 Irrelevant Information
📄 Manipulative Email
📄 Naturalness
📄 Objectivity
📄 Professional Tone
📄 Question Answer Quality
📄 Reference Document Faithfulness
📄 Relevance
📄 Summarization Preference
📄 Temperature In Celsius And Fahrenheit
📄 Truthfulness
📄 User Message General Harm
📄 User Message Jailbreak
📄 User Message Profanity
📄 User Message Social Bias
📄 User Message Unethical Behavior
📄 User Message Violence

Read more about catalog usage here.

<📄 O1 Preview

📄 Adherence With Format>

© Copyright 2023, IBM Research.