Generative AI 개요
Generative AI란 비정형 딥러닝 모델을 사용하여 사용자의 입력에 기반해 새로운 이미지, 텍스트, 음악 등의 콘텐츠를 생성할 수 있는 인공지능 분야로, 22년 미국에서만 약 10억 달러의 투자 규모를 기록했습니다.
CBInsights내 Generative AI 산업군으로 분류되어 있는 250여개의 스타트업 중 33%는 외부 투자를 아직 유치하지 않았으며, 51%의 스타트업은 시리즈 A 전 단계이며, 올해로 Gen AI 마켓 사이즈는 약 6억만달러에 달할 예정이라고 합니다.
현재 시장을 선도하는 Model들로는 Open AI의 Chat GPT-3, GPT-4, DALL E, 그리고 Stability AI의 stable diffusion 등이 있습니다.
Unicorn startups in Generative AI
Company | Description | 자체 기술 개발 | Valuation (USD) | Funding Stage | Year |
OpenAI | Large-Language-model - ChatGPT, Dall-E | O | $29B | N/A | 2015 |
Hugging Face | NLP Toolkit & Open source library | O | $2B | Series C | 2016 |
Lightricks | AR/VR Image fine-tuning tool | X | $1.8B | Series D | 2013 |
Jasper | HR Tech for content & media creation | X | $1.5B | Series A | 2018 |
Glean | Workspace search platform | X | $1B | Series C | 2019 |
Stability AI | Open-source text-to-image generator | O | $1B | Seed VC | 2019 |
Generative AI Application Landscape by Sequoia Capital (2022)
Generative AI Landscape은 크게 Visual Media generation, Text generation, Speech & Audio Generation, Code Generation, Industry-specific generative applications 다섯개의 카테고리로 분류됩니다.
해당 포스트에서는 Generative AI 분야에서 사용되는 핵심 모델 및 기술을 개발하는 기업들에 대한 분석을 다룹니다.
Open AI X Microsoft
Open AI는 2015년 설립된 LLM 기술 개발 스타트업으로 작년 11월 Chat GPT-3.5를 출시하며 출시 5일만에 백만명의 사용자를 돌파했고, 23년 1월을 기준으로는 1억명의 사용자를 기록했으며, 현재까지 하루 평균 2천 5백만명의 유저를 기록하고 있습니다.
23년 3월 중순에는 GPT-4를 출시하며 기존의 Chat GPT 3 보다 향상된 퍼포먼스와 다양한 기능들을 제공하게 되었습니다. 해당 기능은 Chat-GPT 프리미엄 결제를 통해 사용할 수 있습니다.
GPT-4에 추가된 기능
문자, 이미지, 영상까지 결과물로 출력
답변에 대한 안정성 강화 (비윤리적이고 비이상적인 질문에 대한 대답을 82%까지 줄임)
한국어를 비롯한 26개국 사용 언어 추가
Open AI의 기술을 사용하는 대기업들로는 스냅, 듀오링고, 슬랙, 베인엔 컴퍼니 등이 있습니다.
마이크로소프트는 Open AI와 독점적인 파트너십을 맺고 지속적으로 투자 지분을 늘려가며 Generative AI의 독보적인 선도 기업이 되었습니다.
2019년 약 10억 달러를 투자하며 OpenAI의 기술 라이언스를 독점하게 되었으며, 2023년 1월 100억달러를 투자하며 투자비용 회수 시점까지 오픈AI 수익의 75%를 가져가며 , 그 이후에는 MS가 전체 지분의 49%, 다른 투자자들이 49%의 지분을 가져가는 구조의 파트너쉽을 유지하고 있습니다.
MS는 23년 1월 Azure OpenAI service 출시하여 개발자들이 OpenAI 모델을 직접 액세스 하여 최첨단 AI 애플리케이션을 개발할 수 있게끔 지원하고 있습니다.
이에 더해 올해 3월 GPT-4가 탑재된 Bing 검색 엔진(Bing-GPT)을 출시하였고, MS 워드, 엑셀 등의 프로덕트에도 탑재하여 출시 예정중에 있습니다. 이 외에도 깃헙 코파일럿과 같은 자사의 AI 기술들도 MS 포트폴리오에 탑재 예정입니다.
OpenAI와의 파트너쉽 외에도 데이터 센터인 Fungible 등의 회사를 인수하며 공격적인 기술 개발 확장을 이어나가고 있습니다.
빅테크 - Google
이러한 Open AI와 MS를 견제하기 위해 많은 빅테크 기업이 적극적인 LLM, 이미지 생성 모델 기술 개발에 힘쓰고 있습니다.
구글의 BARD, Sparrow, 아마존의 PATE, Meta의 LlaMa, 바이두의 Ernie Bot, Salesforce의 EDICT등이 있습니다. 그 중 MS를 바짝 추격해오고 있는 구글의 기술을 살펴보겠습니다.
구글은 올해 2월 Chat GPT의 대항마로 BARD라는 LLM 모델을 발표했으며, 기존의 BERT 모델에 레이어를 추가해서 기존의 언어모델보다 향상된 퍼포먼스를 보입니다.
현재 Google's Cloud AI 플랫폼에 적용되어 있으며, 구글 검색, 닥스, 지메일, 워크스페이스 등에도 적용될 예정이라고 합니다.
이에 더해 Cloud AI Platform 기능을 제공하여 자사 개발 언어 및 LLM 모델 개발 가능이 가능하며 구글 서치의 광고 프로덕트에도 현재 베타 버젼으로 도입 되었습니다.
23년 2월에는 Anthropic이라는 LLM 기술 개발 스타트업에 3억 달러를 투자하며 파트너쉽을 맺었습니다.
스타트업 - Anthropic
Anthropic은 2021년에 OpenAI의 주요 인사들이 설립하였으며, 23년 2월, Chat GPT를 견제할 Claude라는 언어 모델을 출시하였습니다.
Anthropic의 핵심 인력인 Dario Amodei는 GPT-2, GPT-3 기술 개발을 리드했으며, 당시 Open AI의 VP로 Chat GPT의 안정성과 안전성 개선에 힘썼습니다.
Claude는 Chat GPT와 같이 대용량 언어모델의 기능을 제공함에 더해, Helpful, Honest, Harmless의 세가지 키워드에 기반해 더욱 안전하고 윤리적인 답변을 생성합니다.
23년 2월 구글에게서 3억달러의 투자자금을 확보하며 기술 개발에 Google 의 cloud computing 인프라를 사용합니다.
이 외에도 Robin Ai, Assembly AI, 노션 등의 기업들과 파트너쉽을 맺고 있습니다.
스타트업 - Stability AI
Stability AI는 2019년에 설립되어 2022년 10월에 $1B의 기업가치를 달성하여 유니콘 스타트업으로 자리 잡았습니다. Stable Diffusion이라는 Text-to-image 기술을 개발하여 Open AI DALL-E의 주요 경쟁 업체가 되었습니다.
Hugging Face, RunwayML 등의 다양한 Generative AI Model Developer 기업과 협력하여 발전하고 있습니다. Chat GPT를 견제할 AI-Generated video model을 출시할 예정이며, 영화 산업을 중점적으로 타겟할 예정이라고 합니다.
또 AWS와 파트너십을 맺어 Cloud computing 인프라를 사용하여 기술 개발 비용을 절감하고 있습니다. 하지만, 저작권 보호를 받는 사진을 불법적으로 복제하고 처리한 것으로 게티 이미지에게 고소를 당한 것으로 화제가 된 바가 있습니다.
스타트업 - A121 Labs
AI21 Labs는 2017년에 설립되어 구글, 라이트트릭스, 인텔 출신의 개발자가 리더쉽 팀을 구성하고 있습니다.
주요 기술로는 Jurassic이라는 LLM으로, 업계의 LLM 중 가장 최신의 데이터(22년 6월)로 학습되어 있으며, Task-specific APIs를 통해 사용할 수 있는 오픈 소스 모델입니다.
22년 7월 시리즈 B 라운드에서 6천만 달러의 투자금을 확보했으며, 기업 가치 6억 달러에 이르게 되었습니다. 22년 11월 25000명의 개발자가 베타 버젼 출시에 앞서 체험판 신청을 했으며, AWS cloud AI service를 통한 서비스를 공개했습니다.
Model Developers 기업과 해당 산업에 대한 시사점
향후 몇 년간 Microsoft X OpenAI가 Generative AI 분야의 Model Developer로 시장을 선도할 것으로 예상됩니다.
Google의 BARD 기술력과 포트폴리오(Search, Ads, Docs)의 범용성으로 MS X Open AI를 견제할 수 있을 것으로 예상됩니다.
각광받는 Model Developer 스타트업들은 대부분 OpenAI 등의 주요 기업에서 파생된 인력이 설립하였으며, 대규모 데이터 확보가 기술력의 관건이기에, 스타트업의 기술 개발에 한계가 존재합니다.
또한 Generative AI 기술로 생성된 이미지, 영상물들에 대한 저작권에 대한 가이드라인이 필요하며, 기업들이 언어, 이미지 데이터에 대한 라이선싱을 독점하기 위해 공격적인 라이선싱 파트너쉽을 체결하고 있습니다.
Model development 기술과 산업 대한 몇가지 우려 사항:
AI 모델은 지속적인 기술 개발과 발전을 거듭하며 시간이 지남에 따라 성능이 수렴하며 기업 간 기술 차별성이 사라질 수 있습니다.
또한 AI 모델을 자사 애플리케이션에 도입하던 회사가 막대한 수익/투자로 인해 자본과 고객이 늘어나면 인하우스 AI 개발로 전환할 가능성이 존재하며 그에 따른 Model Developer 들의 파트너쉽 손실 우려 역시 존재합니다.
모든 Generative AI 모델들은 필수적으로 Cloud-hosted GPU를 거치며 결국은 Nvidia, MS Azure, AWS 등의 클라우드 인프라 기업이 Revenue의 대부분을 가져가는 구조입니다.
스타트업의 경우 초기 라운드의 투자금 중 80-90%가 클라우드 제공업체에 들어가며 이를 토대로 Generative AI 시장의 총 수익 중 10-20%는 클라우드 제공업체에 돌아가게 됩니다. 따라서 Model Developer의 순수 영업 이익은 사용 규모를 감안했을 때 상대적으로 적을 수 밖에 없는 구조입니다.
다음 포스팅에서는 Sequoia Capital이 발표한 Generative AI Landscape 분류와 분류 별 각광받는 스타트업을 살펴보겠습니다.