AI 이슈 AI 모델 1등이라는 말, 이제 이렇게 의심해야 한다 OpenAI가 제안한 제3자 평가 플레이북을 바탕으로 AI 벤치마크를 읽는 법을 정리했다. 하네스, 툴 설정, 예산, 오염, 보상 해킹을 확인해야 모델 점수가 실제 도입 판단으로 이어진다. 14분 읽기 · 2026.05.31