MMLU

Study / Research

language understanding across multiple domains

Mentioned in 4 videos

Save the 4 videos on MMLU to your own pod.

Sign up free to keep building your knowledge base on MMLU as more episodes are added.

Get Started Free

Videos Mentioning MMLU

State of AI in 2026: LLMs, Coding, Scaling Laws, China, Agents, GPUs, AGI | Lex Fridman Podcast #490

State of AI in 2026: LLMs, Coding, Scaling Laws, China, Agents, GPUs, AGI | Lex Fridman Podcast #490

Lex Fridman

MMLU dataset mentioned as a benchmark referenced in model evaluation discussions.

A Comprehensive Overview of Large Language Models - Latent Space Paper Club

A Comprehensive Overview of Large Language Models - Latent Space Paper Club

Latent Space

Massive Multitask Language Understanding, a broad benchmark covering diverse subjects to evaluate LLM knowledge.

SmartGPT: Major Benchmark Broken - 89.0% on MMLU + Exam's Many Errors

SmartGPT: Major Benchmark Broken - 89.0% on MMLU + Exam's Many Errors

AI Explained

Stanford CS25: Transformers United V6 I From Next-Token Prediction to Next-Generation Intelligence

Stanford CS25: Transformers United V6 I From Next-Token Prediction to Next-Generation Intelligence

Stanford Online

A benchmark relevant to STEM-focused datasets used in LLM training.