Nathan Habib's picture

Building on HF

Nathan Habib PRO

SaylorTwift

huggingface

·

AI & ML interests

Evals

Recent Activity

new activity 2 days ago

CohereLabs/North-Mini-Code-1.0:Add eval results for SWE-bench Verified, SWE-bench Pro, and Terminal-Bench v2

new activity 3 days ago

CohereLabs/North-Mini-Code-1.0:Add evaluation results (SWE-bench Verified, SWE-bench Pro, Terminal-Bench v2)

liked a model 3 days ago

CohereLabs/North-Mini-Code-1.0

View all activity

Organizations

upvoted a changelog 3 days ago

Hugging Face Changelog

Publish models from CI without HF_TOKEN

5 days ago

• 86

upvoted an article 3 days ago

Article

The Open Source Community is backing OpenEnv for Agentic RL

+15

burtenshaw, spisakjo, lysandre, darktex, willcb, qjoy, pawalt, cwing-nv, danielhanchen, andrewzhou, shimmyshimmer, Hamid-Nazeri, Sanyam, zkwentz, emre0, lewtun, sergiopaniego

•

6 days ago

• 78

upvoted a paper 3 days ago

ResearchClawBench: A Benchmark for End-to-End Autonomous Scientific Research

Paper • 2606.07591 • Published 17 days ago • 87

upvoted an article 6 days ago

Article

Designing the hf CLI as an agent-optimized way to work with the Hub

celinah, Wauplin

•

10 days ago

• 56

upvoted a collection 11 days ago

Holo3.1

Computer use - edge to cloud • 8 items • Updated 11 days ago • 29

upvoted a paper 16 days ago

LFM2 Technical Report

Paper • 2511.23404 • Published Nov 28, 2025 • 61

upvoted a changelog 16 days ago

Hugging Face Changelog

Filter Models page by Base Models only

16 days ago

• 154

upvoted a paper 20 days ago

CHI-Bench: Can AI Agents Automate End-to-End, Long-Horizon, Policy-Rich Healthcare Workflows?

Paper • 2605.16679 • Published 30 days ago • 53

upvoted a changelog 20 days ago

Hugging Face Changelog

Copy Repo Contents to Buckets Instantly

22 days ago

• 80

upvoted a changelog 23 days ago

Hugging Face Changelog

Filter Leaderboards by Model Size

24 days ago

• 127

upvoted a paper 26 days ago

Watch Before You Answer: Learning from Visually Grounded Post-Training

Paper • 2604.05117 • Published Apr 6 • 36

upvoted 3 articles about 1 month ago

Article

EMO: Pretraining mixture of experts for emergent modularity

allenai

•

May 8

• 38

Article

Two Years of Local AI on a Laptop: When Open Models Outpaced Moore's Law

mishig

•

May 11

• 24

Article

Introducing the agentic robotics appstore for 10,000 Reachy Minis

clem

•

May 6

• 36

upvoted a collection about 1 month ago

MediaTech

Collection of public datasets from the French administration, chunked, vectorized and ready to use in AI projects. • 9 items • Updated Feb 4 • 10

upvoted 2 papers about 1 month ago

COMPOSITE-Stem

Paper • 2604.09836 • Published Apr 10 • 3

Claw-Eval-Live: A Live Agent Benchmark for Evolving Real-World Workflows

Paper • 2604.28139 • Published Apr 30 • 42

upvoted a changelog about 2 months ago

Hugging Face Changelog

Spaces agents.md for your coding agents

Apr 17

• 341

upvoted an article about 2 months ago

Article

DeepSeek-V4: a million-token context that agents can actually use

burtenshaw

•

Apr 24

• 50

upvoted a changelog about 2 months ago

Hugging Face Changelog

Agent Traces on the Hub

Apr 7

• 141