Nemotron 3.5 ASR, 한국어 보이스 에이전트와 회의록에 바로 쓸 수 있을까
NVIDIA가 Nemotron 3.5 ASR을 공개했다. 600M 파라미터, 40개 언어 로케일, 한국어 transcription-ready, 80ms부터 1.12초까지 조절 가능한 스트리밍 ASR 모델이다. 회의록, 콜센터, 보이스 에이전트에 어떤 의미가 있는지 공식 모델...
NVIDIA가 Nemotron 3.5 ASR을 공개했다. 600M 파라미터, 40개 언어 로케일, 한국어 transcription-ready, 80ms부터 1.12초까지 조절 가능한 스트리밍 ASR 모델이다. 회의록, 콜센터, 보이스 에이전트에 어떤 의미가 있는지 공식 모델...
Mega-ASR은 깨끗한 스튜디오 음성이 아니라 잡음, 먼 거리 녹음, 반향, 끊김, 압축 손상이 섞인 실제 녹음 환경을 겨냥한 오픈소스 음성인식 모델이다. 회의록, 인터뷰, 콜센터 녹음에 바로 쓸 수...