DNA는 프로그래밍 언어, 식물 유전자의 복잡한 ‘문맥’과 ‘조절 문법’ 스스로 깨우쳐
데이터 장벽 낮은 식물학, 인류 1만 년 작물 개량사를 ‘수개월’로 단축하는 AI 가속기 등극
단순 종자 판매 넘어 ‘맞춤형 유전설계’ 시장 열려… 거대 농화학 기업과 스타트업 간 ‘데이터 플라이휠’ 경쟁 점화
데이터 장벽 낮은 식물학, 인류 1만 년 작물 개량사를 ‘수개월’로 단축하는 AI 가속기 등극
단순 종자 판매 넘어 ‘맞춤형 유전설계’ 시장 열려… 거대 농화학 기업과 스타트업 간 ‘데이터 플라이휠’ 경쟁 점화
이미지 확대보기지난 29일(현지시간) 테크레이더(TechRadar)는 생물학 기반 AI 스타트업 ‘리빙 모델스(Living Models)’가 개발한 AI 파운데이션 모델 ‘보타닉(BOTANIC)’을 집중 조도했다. 이번 보도는 단순한 기술 소개를 넘어, 생명공학이 ‘실험 중심’에서 ‘디지털 설계 중심’ 산업으로 전환되는 경제안보적 변곡점을 시사한다.
'단어' 대신 '염기서열' 읽는 트랜스포머… 유전자의 '맥락'을 파악하다
그동안의 유전체 분석(GWAS, QTL mapping 등)은 특정 유전자 마커와 겉모양(형질) 사이의 단순한 상관관계를 찾는 ‘단어 매칭’ 수준에 머물렀다. 환경이 조금만 바뀌어도 예측력이 급격히 떨어지는 한계가 있었다.
리빙 모델스가 공개한 ‘보타닉’은 1600여 개의 식물 전유전체를 학습하며 이 한계를 정면 돌파했다. 자연어 처리(NLP)에 쓰이는 트랜스포머 구조를 이식해, DNA 염기서열(A·T·G·C)을 하나의 시퀀스 데이터로 처리한다. 이를 통해 유전자가 단독으로 작동하는 것이 아니라, 멀리 떨어진 유전자들이 어떻게 상호작용하는지(상위성, Epistasis), 유전자의 발현을 조절하는 ‘문법’은 무엇인지 스스로 학습한다.
시릴 베랑(Cyril Veran) CEO는 “DNA는 생명체를 구동하는 프로그래밍 언어와 같다”라며 “보타닉은 학습하지 않은 새로운 환경이나 유전적 조합에서도 생물학적으로 타당한 예측을 내놓는 일종의 ‘생물학적 컴파일러’ 역할을 한다”라고 설명했다.
왜 식물인가? 규제 제로·데이터 무제한의 '전략적 요충지'
리빙 모델스가 인간 질병이 아닌 식물을 첫 타깃으로 삼은 것은 치밀한 산업적 계산의 결과다.
인간 게놈은 개인정보(GDPR, HIPAA) 장벽이 높지만, 식물 게놈은 100% 공공 데이터다. 법적 분쟁 없이 수천 개의 게놈을 학습시킬 수 있는 ‘데이터 뷔페’인 셈이다. 데이터 무한 복제가 가능한다.
임상에 10년 이상 걸리는 신약과 달리, 작물은 한 시즌(수개월)이면 실험 결과를 확인하고 모델을 수정(Fine-tuning)할 수 있다. 실패 비용이 낮고 개선 속도는 수십 배 빠르다. 압도적 피드백 속도를 내재하고 있다.
현재 전 세계 종자 시장 규모는 약 600억~700억 달러(약 91조~106조 원) 수준으로, 테크레이더 보도에 따르면, 기존 10년이 걸리던 육종 기간을 AI로 수개월로 단축할 경우 발생하는 비용 절감과 식량 안보 가치를 합산했을 때, 농업 기술(Agri-Tech) 시장은 단숨에 100조 원 이상의 거대 패러다임으로 진입할 수 있다는 전망도 나온다.
시장 구조의 재편, 누가 '생물학의 엔비디아'가 될 것인가
업계에서는 이번 보타닉의 등장을 농업계의 ‘딥시크(DeepSeek) 모먼트’로 평가한다. 바이엘, 신젠타 등 전통의 농화학 거인들이 수조 원을 쓰고도 도달하지 못한 ‘범용 생물학 모델’을 소수 정예 AI 팀이 효율적으로 구축했기 때문이다.
현재 이 시장은 세 가지 층위(Layer)로 재편되고 있다. 첫 번째 모델 층(리빙 모델스처럼 범용 생물학 지능을 제공하는 기업) 두 번째는 데이터 층(수십 년간의 재배 노하우와 독점적 형질 데이터를 가진 종자 기업) 세 번째는 실험 층(모델의 가설을 실제 밭에서 검증하는 인프라)dleek.
리빙 모델스는 모델 가중치를 공개(Open Weights)해 표준을 선점한 뒤, 개별 기업의 독점 데이터를 결합해 맞춤형 모델을 만들어주는 수익 모델을 택했다. 이는 장기적으로 종자 주권이 ‘누가 더 정교한 모델과 양질의 실측 데이터를 결합하느냐’에 달려 있음을 보여준다.
'생물학적 환각'과 데이터 편향… 넘어야 할 산
물론 장밋빛 전망만 있는 것은 아니다. AI가 그럴싸하지만 실제로는 생존 불가능한 유전 조합을 제시하는 ‘생물학적 환각’은 여전히 위협적이다. 또한, 학습 데이터가 경제성이 높은 주요 작물에 쏠려 있어 종의 다양성을 해칠 수 있다는 지표도 나온다.
이 기술이 완성되려면 AI의 가설을 빠르게 검증할 ‘스마트 팜’과 ‘자동화 실험실(Wet Lab)’의 속도가 뒷받침되어야 한다. 리빙 모델스의 도전은 이제 시작이다. 생명공학이 ‘우연한 발견’의 영역에서 ‘정밀한 설계’의 영역으로 넘어가는 지금, 우리는 생물학이 소프트웨어 산업화되는 현장을 목격하고 있다.
투자자들이 지켜봐야 할 체크포인트는 첫째, 브리딩 사이클(Breeding Cycle) 단축이다. 전통적 육종(5~12년)이 AI로 인해 얼마나 줄어드는지 주시해야 한다. 둘째, 독점 데이터의 가치다. 범용 모델이 흔해질수록 기업이 숨겨둔 '실제 재배 데이터'의 몸값은 폭등할 것이다. 셋째, 규제 샌드박스로 AI 설계 작물에 대한 각국 정부의 승인 절차 간소화 여부가 산업의 폭발적 성장을 결정할 핵심 변수다.
김주원 글로벌이코노믹 기자 park@g-enews.com
































