AI 툴 2026.05.21

Google Co-Scientist 공개: 논문 요약기가 아니라 가설 생성 에이전트다

Google Co-Scientist 공개: 논문 요약기가 아니라 가설 생성 에이전트다

핵심 요약

Google이 I/O 2026 공개 윈도우에서 Co-Scientist를 전면에 올렸다. 공식 블로그 날짜는 2026년 5월 19일이고, 한국 독자가 체감한 Google I/O 공개 시점은 2026년 5월 20일 새벽 2시 KST 전후다. Nature에는 같은 날 Co-Scientist 논문이 올라왔고, Google Labs에는 Gemini for Science 실험 도구 사전 관심 등록 페이지가 열렸다.

이 발표를 “AI 논문 검색 도구” 정도로 보면 핵심을 놓친다. Co-Scientist는 연구자가 던진 문제를 받아 관련 문헌을 훑고 요약하는 데서 멈추지 않는다. 연구 목표를 여러 후보 가설로 분해하고, 에이전트끼리 서로 비판하고, Elo 방식의 아이디어 토너먼트로 우선순위를 매긴 뒤, 사람이 검토할 수 있는 연구 제안서와 실험 방향으로 정리하는 시스템이다.

Google Co-Scientist 공식 이미지

이미지 출처: Google Korea Blog 공식 Co-Scientist 이미지. 본문 첫 이미지이며 카드 썸네일로도 사용할 수 있다.

Google은 이번 공개를 Gemini for Science라는 더 큰 묶음 안에 넣었다. 그 안에는 Co-Scientist 기반 Hypothesis Generation, AlphaEvolve와 Empirical Research Assistance 기반 Computational Discovery, NotebookLM 기반 Literature Insights가 들어간다. 쉽게 말하면 “문헌을 찾는 도구”, “가설을 만드는 도구”, “코드와 실험 후보를 대량 평가하는 도구”를 한 과학 워크벤치로 묶으려는 시도다.

왜 지금 중요한가

최근 AI 연구 자동화 흐름은 두 갈래로 빠르게 굳어지고 있다. 하나는 OpenAI가 보여준 수학 문제 돌파처럼, 모델이 기존 연구 문제에서 새 증명이나 반례 후보를 만드는 방향이다. 다른 하나는 Google Co-Scientist처럼, 연구자의 질문을 받아 가설 후보를 만들고 실제 실험실 검증 루프로 넘기는 방향이다.

두 흐름은 겉으로 비슷하지만 쓰임새가 다르다. OpenAI의 에르되시 문제 사례가 “모델이 어려운 문제 하나에서 독립적인 수학 아이디어를 만들 수 있는가”를 보여줬다면, Co-Scientist는 “연구실의 반복적인 가설 탐색 병목을 줄일 수 있는가”에 가깝다. 특히 생명과학은 논문, 유전자 데이터베이스, 단백질 정보, 약물 후보, 실험 프로토콜이 한꺼번에 얽힌다. 사람이 모든 연결을 머릿속에서 추적하기 어렵고, 좋은 연구 질문도 분야 경계를 넘나들 때 나온다.

Google이 강조한 문제의식도 여기에 있다. 매년 쌓이는 논문과 데이터가 너무 많아져서, 개별 연구자가 전체 그림을 보기 어려워졌다. “더 많이 읽어라”로 해결될 문제가 아니다. 연구자는 무엇을 읽을지, 어떤 연결이 유망한지, 어떤 가설이 실험 가능한지부터 결정해야 한다. Co-Scientist는 바로 이 앞단의 의사결정을 기계적으로 넓게 탐색한 뒤 사람이 판단할 후보군으로 좁혀주는 역할을 노린다.

작동 방식: 생성, 토론, 진화

Co-Scientist의 구조는 단일 챗봇이 아니다. Google DeepMind 설명에 따르면 Gemini 기반 전문 에이전트들이 서로 다른 역할을 맡는다. 생성 에이전트는 문헌과 데이터를 바탕으로 초기 연구 방향을 제안한다. Proximity 에이전트는 비슷한 가설을 묶고 연구 공간이 한쪽으로 쏠리지 않게 만든다. Reflection 에이전트는 가상의 동료 평가자처럼 가설의 정확성, 품질, 참신성을 비판한다. Ranking 에이전트는 아이디어 토너먼트를 돌려 후보 간 우열을 비교한다. Evolution 에이전트는 상위 후보를 결합하거나 다듬는다. Meta-review 에이전트는 토론 결과를 종합해 연구자가 읽을 수 있는 최종 제안으로 만든다.

Co-Scientist의 Generate, Debate, Evolve 루프

이미지 출처: Google Korea Blog 공식 Co-Scientist 작동 방식 이미지.

중요한 점은 “가설을 많이 만들기”보다 “좋은 가설을 골라내기”에 계산을 많이 쓴다는 것이다. Google은 Co-Scientist가 수천 개 연구 방향을 탐색할 수 있고, 그중 유망한 후보를 찾기 위해 아이디어 토너먼트를 사용한다고 설명한다. 이 토너먼트는 AlphaGo나 AlphaStar에서 쓰인 자기 대결의 발상을 과학적 토론에 옮긴 것이다. 다만 게임 승패 대신 가설의 견고함, 검증 가능성, 참신성을 비교한다.

이 구조가 기존 문헌 요약 도구와 갈라지는 지점은 검증 루프다. 일반적인 논문 요약 AI는 사용자가 준 논문 묶음을 잘 정리해준다. Co-Scientist는 웹 검색과 ChEMBL, UniProt 같은 전문 데이터베이스를 연결해 주장을 교차 확인하고, 일부 협업에서는 AlphaFold 같은 전문 모델도 도구로 쓸 수 있다고 밝혔다. 그래서 산출물은 “이 분야 논문들은 대체로 이렇게 말합니다”가 아니라 “이 연결이 실험해볼 만한 이유는 이것이고, 약한 지점은 이것이며, 다음 실험은 이렇게 설계할 수 있습니다”에 가까워진다.

실험실 검증이 붙은 이유

이 발표가 단순 제품 소개보다 무겁게 읽히는 이유는 Nature 논문과 실제 연구 사례가 같이 나왔기 때문이다. Nature 논문 제목은 Accelerating scientific discovery with Co-Scientist이고, DOI는 10.1038/s41586-026-10644-y다. 논문은 2025년 3월 20일 접수, 2026년 5월 11일 승인, 2026년 5월 19일 게재로 기록돼 있다.

Google이 공개한 사례도 가설 생성 도구의 성격을 잘 보여준다. 간 섬유화 연구에서는 기존에 덜 주목받던 약물 재창출 후보를 찾아냈고, 그중 하나가 실험실 테스트에서 흉터 형성과 관련된 반응을 최대 91% 차단했다고 밝혔다. 세포 노화 연구에서는 수십 년치 문헌을 종합해 유전적 리드를 제안하고, 대규모 스크리닝 데이터 분석 시간을 몇 달에서 며칠로 줄였다고 설명했다. 감염병 연구에서는 병원체가 동물에서 사람으로 넘어올 때 중증 질환을 일으키는 단백질 후보와 아미노산 후보를 좁히는 데 쓰였다.

여기서 조심할 점도 있다. “AI가 신약을 만들었다”는 식으로 쓰면 과장이다. 공식 자료의 언어는 대체로 “도왔다”, “후보를 제안했다”, “실험실 검증으로 뒷받침됐다”에 머문다. 즉 Co-Scientist는 실험실을 대체하는 기계가 아니라, 실험실이 어디에 시간을 쓸지 정하는 탐색 엔진에 가깝다. 생명과학에서 가장 비싼 단계는 결국 wet lab 검증이고, 그 책임은 여전히 사람 연구자에게 남는다.

연구 워크플로우는 어떻게 바뀌나

Co-Scientist가 실제로 자리 잡으면 연구자의 하루가 바뀐다. 기존 흐름은 대략 이렇다. 연구자가 문제를 정하고, 관련 문헌을 모으고, 선행 연구의 빈틈을 찾고, 후보 가설을 몇 개 세운 뒤, 동료와 토론하고, 예산과 장비에 맞는 실험 계획을 고른다. 이 과정은 좋은 연구실에서도 몇 주에서 몇 달이 걸릴 수 있다. 분야가 바뀌거나 협업자가 많아지면 더 느려진다.

Co-Scientist가 노리는 자리는 이 중 앞부분이다. 연구자가 “이 질환에서 왜 특정 환자군만 약물에 반응하는가” 같은 질문을 넣으면, 시스템은 문헌과 데이터베이스를 훑고, 가능한 메커니즘을 여러 갈래로 만든다. 그다음 스스로 약점을 지적하고, 후보끼리 비교하고, 최종적으로 “이 후보는 새롭지만 검증 비용이 높다”, “이 후보는 참신성은 낮지만 빠르게 확인 가능하다” 같은 우선순위 정보를 준다.

이 변화의 의미는 단순한 시간 단축이 아니다. 연구팀의 병목이 “누가 논문을 더 많이 읽었는가”에서 “어떤 가설을 실험할 가치가 있는가”로 이동한다. AI가 넓게 훑어주는 만큼 연구자는 더 많이 믿는 것이 아니라 더 잘 의심해야 한다. Co-Scientist가 내놓은 가설은 정답이 아니라 후보이며, 좋은 연구자는 그 후보의 전제와 데이터 근거를 다시 확인해야 한다.

또 하나의 변화는 협업 방식이다. MIT의 Ritu Raman 사례처럼 Co-Scientist는 한 연구자가 어떤 보완 전문성을 가진 동료와 협업해야 하는지 찾는 데도 쓰였다. 이것은 흥미롭다. 연구 자동화의 끝이 “혼자 다 하는 AI 과학자”가 아니라, 오히려 사람 연구자 사이의 연결을 더 빨리 만드는 방향일 수 있기 때문이다.

바로 쓸 수 있나

개별 연구자 관점에서는 Gemini for Science 쪽을 보면 된다. Google Labs의 Science experimental tools 페이지에는 Literature Insights, Hypothesis Generation, Computational Discovery가 올라와 있고, 관심 등록 버튼이 열려 있다. Hypothesis Generation이 Co-Scientist 기반 도구다. Google AI의 Gemini for Science 페이지도 같은 묶음을 소개하며, Science Skills in Google Antigravity로 구조 생물정보학과 유전체 분석 같은 복잡한 워크플로우를 몇 시간에서 몇 분으로 줄이는 사용 사례를 제시한다.

기업과 연구기관 관점에서는 Google Cloud 문서가 더 중요하다. 문서에는 Co-Scientist와 AlphaEvolve가 Gemini Enterprise의 Google-developed agents로 소개돼 있으며, 상태는 Preview다. 또한 이 기능은 Pre-GA Offerings Terms가 적용되고, 접근은 제한되어 있으며, 요청하려면 Google account team에 문의해야 한다고 명시돼 있다. 즉 오늘 당장 누구나 결제해서 쓰는 공개 SaaS라기보다는, 개별 연구자 실험 도구와 엔터프라이즈 제한 접근이 병행되는 단계다.

정리하면 다음과 같다.

  • 개인 연구자: Google Labs Science 페이지에서 관심 등록
  • 제품 개요 확인: Gemini for Science 공식 페이지
  • 에이전트형 개발 환경 사용: Google Antigravity의 Science Skills 문서
  • 기업·연구기관 도입: Google Cloud 계정팀을 통한 제한 접근 문의

한계와 관전 포인트

첫 번째 한계는 책임이다. Google DeepMind는 Co-Scientist가 과학적·임상적 전문성을 대체하지 않으며, 사용자가 출력 기반 의사결정에 책임을 진다고 적었다. 이 문장은 형식적인 면책처럼 보이지만 실제로 중요하다. 생명과학 가설은 잘못된 우선순위만으로도 실험비와 시간을 크게 낭비할 수 있고, 임상으로 가까워질수록 안전 문제가 커진다.

두 번째 한계는 평가다. Co-Scientist는 Elo 기반 자동 평가와 전문가 선호 평가를 섞어 후보를 고른다. 이 방식은 탐색을 확장하는 데 유용하지만, 자동 평가가 실제 과학적 진실을 대신하지는 않는다. 특히 “참신해 보이는 가설”과 “검증 가능한 가설”은 다르다. AI가 더 많은 후보를 만들수록, 연구자는 더 강한 필터를 가져야 한다.

세 번째 한계는 접근성이다. Google Labs 관심 등록이 열렸다고 해서 모든 기능이 즉시 전체 공개된 것은 아니다. Google Cloud 문서도 제한 접근과 Preview 상태를 분명히 한다. 한국 연구기관이나 바이오 스타트업이 바로 도입하려면 내부 데이터 반출, 보안, 지식재산권, 실험 기록 관리, IRB와 임상 규정까지 같이 검토해야 한다.

그래도 방향은 선명하다. Co-Scientist는 “논문을 잘 요약하는 AI”가 아니라 “연구 질문을 실험 가능한 후보로 바꾸는 AI”다. OpenAI의 수학 성과가 AI가 새 수학 아이디어를 만들 수 있음을 보여주는 신호라면, Google의 Co-Scientist는 AI가 연구실의 가설 생성 루프에 들어오기 시작했다는 신호다. 앞으로 볼 지점은 세 가지다. 첫째, Google Labs 실험 도구가 언제 얼마나 넓게 열린다. 둘째, Nature 이후 독립 연구팀의 재현·검증 사례가 얼마나 쌓인다. 셋째, Co-Scientist가 AlphaFold, AlphaGenome, NotebookLM, Antigravity와 어디까지 하나의 연구 워크벤치로 묶인다.

AI 과학 도구의 승부는 멋진 데모가 아니라 “실험실이 다음 주에 실제로 무엇을 다르게 하게 만드는가”에서 갈린다. Co-Scientist가 의미 있는 이유는 바로 그 지점을 제품 구조로 건드렸기 때문이다.

공식 링크와 출처

공유

Threads X