EVA-Bench Data 2.0, 음성 에이전트 평가는 이제 말귀보다 업무 완료다
ServiceNow-AI가 EVA-Bench Data 2.0을 공개했다. 항공 고객지원, 기업 ITSM, 헬스케어 HRSD 3개 도메인, 121개 도구, 213개 시나리오로 음성 에이전트가 인증, 정책, 도구 호출, 최종 DB 상태까지 제대로 처리하는지...
ServiceNow-AI가 EVA-Bench Data 2.0을 공개했다. 항공 고객지원, 기업 ITSM, 헬스케어 HRSD 3개 도메인, 121개 도구, 213개 시나리오로 음성 에이전트가 인증, 정책, 도구 호출, 최종 DB 상태까지 제대로 처리하는지...
NVIDIA가 Nemotron 3.5 ASR을 공개했다. 600M 파라미터, 40개 언어 로케일, 한국어 transcription-ready, 80ms부터 1.12초까지 조절 가능한 스트리밍 ASR 모델이다. 회의록, 콜센터, 보이스 에이전트에 어떤 의미가 있는지 공식 모델...