12 5

Hoang Nguyen

hnguy7

AI & ML interests

None yet

Recent Activity

liked a dataset about 15 hours ago

ServiceNow-AI/asr_codeswitched

upvoted an article about 16 hours ago

Can Voice Agents Handle Bilingual Customers? Benchmarking Frontier ASR on Code-Switched Speech

liked a dataset 6 days ago

ServiceNow-AI/eva-bench

View all activity

Organizations

upvoted an article about 16 hours ago

Article

Can Voice Agents Handle Bilingual Customers? Benchmarking Frontier ASR on Code-Switched Speech

ServiceNow-AI

•

about 18 hours ago

• 34

upvoted an article 6 days ago

Article

EVA-Bench Data 2.0: 3 Domains, 121 Tools, 213 Scenarios

ServiceNow-AI

•

6 days ago

• 38

upvoted a paper 27 days ago

EVA-Bench: A New End-to-end Framework for Evaluating Voice Agents

Paper • 2605.13841 • Published 29 days ago • 74

upvoted a paper 28 days ago

Do Enterprise Systems Need Learned World Models? The Importance of Context to Infer Dynamics

Paper • 2605.12178 • Published 30 days ago • 61

upvoted an article 2 months ago

Article

Welcome Gemma 4: Frontier multimodal intelligence on device

merve, pcuenq, sergiopaniego, burtenshaw, Steveeeeeeen, alvarobartt, SaylorTwift

•

Apr 2

• 907

upvoted a paper 2 months ago

Terminal Agents Suffice for Enterprise Automation

Paper • 2604.00073 • Published Mar 31 • 96

upvoted an article 3 months ago

Article

A New Framework for Evaluating Voice Agents (EVA)

ServiceNow-AI

•

Mar 24

• 95

upvoted a paper 3 months ago

EnterpriseOps-Gym: Environments and Evaluations for Stateful Agentic Planning and Tool Use in Enterprise Settings

Paper • 2603.13594 • Published Mar 13 • 149

upvoted a collection 9 months ago

AU-Harness datasets

Collection

3 items • Updated Sep 12, 2025 • 6

upvoted 2 papers 9 months ago

AU-Harness: An Open-Source Toolkit for Holistic Evaluation of Audio LLMs

Paper • 2509.08031 • Published Sep 9, 2025 • 21

Apriel-Nemotron-15B-Thinker

Paper • 2508.10948 • Published Aug 13, 2025 • 6

upvoted a paper almost 2 years ago

M2Lingual: Enhancing Multilingual, Multi-Turn Instruction Alignment in Large Language Models

Paper • 2406.16783 • Published Jun 24, 2024 • 4

Hoang Nguyen

AI & ML interests

Recent Activity

Organizations

hnguy7's activity

Can Voice Agents Handle Bilingual Customers? Benchmarking Frontier ASR on Code-Switched Speech

EVA-Bench Data 2.0: 3 Domains, 121 Tools, 213 Scenarios

Welcome Gemma 4: Frontier multimodal intelligence on device

A New Framework for Evaluating Voice Agents (EVA)