우린 50달러면 돼” 미 연구팀 증류기술 이용해 고성능 AI 개발
페이지 정보
pike관련링크
본문
![2025020819493794481.jpeg](https://www.missyusa.com/fileServer/ImageServer/upload/talk6/20252/2025020819493794481.jpeg)
전세계에 충격과 희망을 동시에 안겨 준 중국 인공지능(AI) 스타트업 딥시크처럼 ‘증류기술’을 이용해 단돈 50달러로 만든 미국 AI가 공개됐다. 미 스탠퍼드대와 워싱턴주립대(University of Washington) AI 연구팀의 성과다. 미 정보기술(IT) 전문 온라인 매체 테크크런치는 두 대학 연구진이 50달러도 안 들이고 AI ‘추론’ 모델을 7일(현지시간) 공개했다고 보도했다. 이들 연구진이 개발한 모델은 딥시크의 R1에 빗댄 듯 ‘s1’이라는 이름이 붙었다. s1 또한 오픈AI의 'o1(오원),' 딥시크의 'R1'처럼 첨단 추론 모델로서 제대로 된 성능을 발휘했다. R1이 그랬던 것처럼 수학, 코딩 능력이 첨단 AI와 견줄 정도였다. 연구진은 깃허브(GitHub) 웹서비스에 관련 데이터, 코드와 함께 s1 모델을 올려 누구나 사용할 수 있도록 했다. s1 팀은 특별히 모델을 개발하는 대신 흔하게 구할 수 있는(off-the-shelf) 기본 모델을 토대로 AI를 구축했다면서 딥시크도 활용한 것으로 추정되는 이른바 ‘증류(distillation)’ 기술을 통해 이를 정교하게 다듬었다고 밝혔다. 이들을 증류 기술을 활용해 대답을 이끌어내는 방식으로 다른 AI 모델의 ‘추론’ 능력을 뽑아냈다. 연구진은 s1이 구글의 AI 추론 모델인 '제미나이 2.0 플래시 싱킹 익스페리멘털(Gemini 2.0 Flash Thinking Experimental)' 가운데 하나에서 증류됐다고 밝혔다. 앞서 버클리대 연구팀도 지난달 이 증류 기술을 이용해 약 450달러에 AI 추론 모델을 만든 바 있다. s1은 중국 알리바바 소유의 AI 연구소 췐(Qwen)이 무료로 배포하는 덩치가 작은 모델을 토대로 만들어졌다. 연구진은 s1 훈련을 위해 정교하게 조합된 질문 단 1000개를 만들어 그 답을 함께 제시했다. 또 구글 제미나이 2.0 플래시 싱킹 익스페리멘털로부터 각각 답을 구해 그 과정의 이면에 숨겨진 ‘사고(싱킹)’도 함께 AI에게 제공했다. 연구진은 엔비디아 H100 그래픽반도체(GPU) 16개를 활용해 30분도 채 안 걸려 s1이 특정 AI 기준을 충족할 정도로 훈련시켰다. 이 프로젝트에 참여한 스탠퍼드대 연구원 니클라우스 뭬닝호프는 지금 같으면 한 20달러면 이 s1 훈련에 필요한 컴퓨터 연산 능력을 임대할 수 있다고 말했다. 테크크런치는 그러나 R1, s1 등의 사례에서 보듯 적은 돈으로 엄청난 투자가 이뤄진 AI 모델을 흉내 낼 수 있는 것이 가능하다면 AI 모델이 상업적으로 성공할 수 있을지 의문이 제기될 수밖에 없다고 지적했다. 이미 오픈AI는 딥시크가 증류기술을 이용해 자사 AI 모델의 데이터를 부적절하게 ‘추수’했다며 비판하고 있다. 한편 마이크로소프트(MS), 알파벳, 아마존, 메타플랫폼스 등 대형 클라우드 업체 빅4는 올해에도 AI에 대대적으로 투자할 계획이다. MS는 800억달러, 알파벳은 750억달러, 아마존은 1050억달러를 투자하기로 했다. 메타는 600억~650억달러를 투자할 계획이다. dympna@fnnews.com 송경재 기자 |
추천 0
작성일2025-02-08 21:39
짐라이님의 댓글
짐라이
결국 약장수같이 아는것 그럴싸 하게 주절대는 인공지능은 가치가 없다는 이야긷 되네