AI Scientist 최신 동향 분석 (2025년 12월 기준)

12월 09, 2025

AI Scientist 최신 동향 분석 (2025년 12월 기준)

1. 핵심 개념 및 정의

AI Scientist는 대형 언어 모델(LLM)과 에이전트 시스템을 결합하여 과학 연구의 전 과정을 자동화하는 시스템입니다. 문헌 검색, 가설 생성, 실험 설계, 데이터 분석, 논문 작성까지 최소한의 인간 개입으로 수행할 수 있습니다.

2. 주요 AI Scientist 플랫폼 및 시스템

2.1 Sakana AI - The AI Scientist v2 (2025년 4월)

AI Scientist-v2는 최초의 완전 AI 생성 워크숍 논문을 피어리뷰에서 통과시킨 end-to-end 에이전트 시스템입니다. 이 시스템은 과학적 가설 수립, 실험 설계 및 실행, 데이터 분석 및 시각화, 과학 논문 자율 작성을 수행합니다. 특히 인간이 작성한 코드 템플릿에 의존하지 않고 다양한 ML 도메인에 효과적으로 일반화됩니다.

2.2 Edison Scientific - Kosmos (2025년 11월)

Kosmos는 구조화된 세계 모델(structured world model)을 사용하여 수백 개의 에이전트 궤적에서 추출한 정보를 효율적으로 통합합니다. 단일 Kosmos 실행은 1,500개의 논문을 읽고 42,000줄의 분석 코드를 실행하며, 최대 12시간 동안 병렬 데이터 분석, 문헌 검색, 가설 생성 사이클을 수행합니다.

독립 과학자들이 Kosmos 보고서의 79.4%가 정확하다고 평가했으며, 협력자들은 단일 20-cycle Kosmos 실행이 평균 6개월의 연구 시간에 해당한다고 보고했습니다.

2.3 FutureHouse - Robin 시스템 (2025년 5월)

Robin은 모든 가설, 실험 선택, 데이터 분석, 논문의 주요 그림을 자율적으로 생성합니다. 인간 연구자는 물리적 실험만 수행했으며, 지적 프레임워크는 전적으로 AI가 주도했습니다. Robin 구상부터 논문 제출까지 전체 과정이 단 2.5개월 만에 완료되었습니다.

Robin은 dry age-related macular degeneration(dAMD)에 대한 새로운 치료 후보물질(Ripasudil)을 자율적으로 제안, 테스트, 검증했습니다.

2.4 Google - AI Co-Scientist (2025년 2월)

AI co-scientist는 Gemini 2.0 기반의 다중 에이전트 AI 시스템으로, 새로운 가설과 연구 제안을 생성하는 가상 과학 협력자입니다.

검증된 성과:

급성 골수성 백혈병(AML)에 대한 새로운 약물 재창출 후보 제안 및 실험적 검증
간 섬유증에 대한 후성유전학적 타겟 발견 - Stanford 대학과 협력하여 인간 간 오가노이드에서 유의미한 항섬유화 활성 확인
항균제 내성(AMR) 관련 박테리아 유전자 전달 진화 메커니즘 가설 생성 - Imperial College 연구팀이 이미 발견했지만 미발표 상태였던 동일한 가설을 독립적으로 제안

2.5 HKUDS - AI-Researcher (NeurIPS 2025 Spotlight)

AI-Researcher는 문헌 검토, 가설 생성, 알고리즘 구현, 출판 준비 원고 작성까지 전체 연구 파이프라인을 최소한의 인간 개입으로 조율하는 완전 자율 연구 시스템입니다. Scientist-Bench라는 종합 벤치마크를 통해 평가됩니다.

3. 산업계 주요 동향

3.1 Anthropic - Claude for Life Sciences (2025년 10월)

Anthropic은 생명과학 연구자를 위한 Claude for Life Sciences를 출시했습니다. 문헌 검토, 데이터 분석, 규제 문서 작성 등 전체 연구 과정을 지원합니다. Benchling, PubMed, 10x Genomics, BioRender 등과 통합되어 있습니다.

Claude Sonnet 4.5는 Protocol QA 벤치마크에서 0.83점을 기록하여 인간 기준(0.79)을 초과했습니다. Novo Nordisk는 Claude를 사용하여 임상 문서화 프로세스를 10주 이상에서 10분으로 단축했습니다.

3.2 Google DeepMind - AlphaFold 5주년 & Isomorphic Labs

Demis Hassabis CEO는 2025년 말까지 AI 설계 약물의 임상 시험 진입을 목표로 한다고 발표했습니다. Isomorphic Labs는 종양학, 심혈관, 신경퇴행성 질환 영역에 집중하고 있습니다.

AlphaFold 2는 출시 5년 만에 330만 명 이상이 사용했으며, 40,000개 이상의 학술 논문에 직접 인용되었고, 400개 이상의 성공적인 특허 출원에 언급되었습니다.

3.3 Lila Sciences - Scientific Superintelligence

Flagship Pioneering이 인큐베이팅한 Lila Sciences는 2억 달러의 시드 펀딩으로 출범했으며, "scientific superintelligence" 플랫폼 구축을 목표로 합니다.

2025년 9월 2억 3,500만 달러 추가 펀딩으로 유니콘 지위(12.3억 달러 가치평가)에 도달했습니다. AI Science Factories를 통해 수십만 건의 AI 주도 실험을 수행했습니다.

3.4 Insilico Medicine & Eli Lilly 협력 확대

Insilico Medicine은 Eli Lilly와 연구 및 라이선싱 협력을 확대했습니다. Insilico의 Pharma.AI 플랫폼을 사용하여 치료 후보물질을 발굴하고 최적화하며, 계약 가치는 선급금, 마일스톤, 로열티를 포함하여 1억 달러를 초과할 수 있습니다.

4. Self-Driving Labs (자율 실험실)

4.1 기술 발전

Self-driving labs(SDLs)는 AI와 실험실 자동화를 결합하여 가설 생성, 실험 설계, 실험 수행, 데이터 분석, 결론 도출, 가설 업데이트까지 과학적 방법의 거의 모든 단계를 자동화합니다.

NC State 연구팀은 동적 화학 실험을 사용하는 self-driving lab을 개발하여 이전 기술보다 10배 더 많은 데이터를 수집하고 재료 발견을 극적으로 가속화했습니다.

4.2 자동화 수준 분류

연구자들은 실험실 자동화를 5단계로 정의했습니다:

A1 (보조 자동화): 액체 처리 등 개별 작업 자동화
A2 (부분 자동화): 로봇이 여러 순차적 단계 수행
A3 (조건부 자동화): 로봇이 전체 실험 과정 관리
A4 (고도 자동화): 로봇이 독립적으로 실험 실행
A5 (완전 자동화): AI 시스템이 자체 유지보수 포함 완전 자율 운영

5. AI Scientist 학술 컨퍼런스

Stanford 컴퓨터 과학자 James Zou가 주최하는 Agents4Science는 AI에 의해 연구, 작성, 검토된 작업만을 공유하는 최초의 학술 컨퍼런스입니다. 모든 제출물의 주저자가 AI여야 하며, 다른 봇들이 과학적 가치를 평가합니다.

6. 주요 도전과제 및 한계

6.1 기술적 한계

Google AI co-scientist의 검증 사례에서, "약물 재창출"이라고 주장된 실험은 실제로는 이미 알려진 화합물을 세포주에서 테스트한 것으로, 생체 내 효능 및 안전성 검증이 부족합니다.

6.2 구조적 도전

AI가 패턴 인식과 예측에 뛰어나지만, 인과 추론, 메커니즘적 이해, 창의성, 가설 형성 및 정제 능력 등 인간 과학적 탐구를 정의하는 역량은 여전히 부족합니다.

현재 AI Scientist 패러다임은 데이터 및 모델 기반 가상 환경에 국한되어 있으며, 실제 물리적 실험과 인지적 통찰을 물리적 행동으로 전환하는 능력이 부족합니다.

이 블로그 검색

SEIHWAN