소식

Cartesia: 새로운 AI 모델 아키텍처로 AI 혁신의 문을 열다

ITnewB 2024. 12. 12. 22:08
728x90
반응형

AI 기술이 급격히 발전하며 다양한 분야에서 혁신을 이끌고 있지만, 그만큼 운영 비용도 급등하고 있습니다.

OpenAI의 경우 올해 운영 비용만 70억 달러에 이를 것으로 예상되며, 차세대 AI 모델 개발 비용은 100억 달러를 초과할 가능성도 제기되고 있습니다. 이런 배경 속에서 Cartesia는 새로운 모델 아키텍처를 통해 AI의 효율성을 극대화하고 비용을 절감하는 데 주력하고 있습니다.


🌟 Cartesia의 핵심 기술: SSMs(State Space Models)

Cartesia는 기존의 AI 모델 구조인 트랜스포머(transformer) 아키텍처를 대체할 수 있는 **SSMs(State Space Models)**를 개발 및 상용화하고 있습니다.

SSM과 트랜스포머의 차이점

  • 트랜스포머
    • 데이터를 처리하며 모든 과거 데이터를 메모리에 저장하여 연산량이 많고 비용이 높습니다.
    • 데이터를 처리한 후에도 '숨겨진 상태(hidden state)'를 전체적으로 다시 스캔해야 하기 때문에 비효율적입니다.
  • SSM
    • 이전 데이터들을 요약하여 새로운 데이터가 들어올 때 메모리를 업데이트하고 이전 데이터를 대부분 삭제합니다.
    • 이러한 특성 덕분에 대량의 데이터를 처리하면서도 계산 비용을 크게 절감할 수 있습니다.

SSM의 장점

  • 대규모 데이터 처리에 적합
  • 특정 데이터 생성 작업에서 트랜스포머보다 더 나은 성능 제공
  • 낮은 추론 비용으로 효율적인 모델 운영 가능

📜 Cartesia의 창립 배경

Cartesia는 스탠포드 AI 연구실에서 Ph.D. 과정을 밟던 Karan GoelAlbert Gu가 개발한 연구에서 시작되었습니다.

  • Mamba 프로젝트: Albert Gu와 Princeton 교수 Tri Dao가 시작한 오픈 리서치 프로젝트로, 현재 가장 인기 있는 SSM 중 하나로 자리 잡았습니다.
  • Cartesia는 Mamba를 기반으로 자체 모델을 구축하며 AI 모델의 메모리와 효율성을 개선하는 데 집중하고 있습니다.

2023년, Goel과 Gu는 스탠포드 동료들과 함께 Cartesia를 설립하여 연구를 상용화하기로 결정했습니다.


🚀 Cartesia의 주요 제품과 서비스

Cartesia는 SSM을 기반으로 한 다양한 제품을 출시하며 AI 시장에서 주목받고 있습니다.

Sonic

  • 음성 클론 및 생성 모델: Sonic은 사람의 목소리를 복제하거나 새로운 음성을 생성하고, 톤과 속도까지 조정할 수 있습니다.
  • API와 대시보드 제공: Sonic은 API와 웹 대시보드를 통해 빠르고 안정적으로 음성 데이터를 처리합니다.
  • 활용 분야:
    • 게이밍, 음성 더빙, 실시간 번역 등

Sonic On-Device

  • 모바일 최적화 모델: Sonic의 모바일 버전으로, 휴대폰과 같은 디바이스에서 실시간 번역과 같은 애플리케이션을 지원합니다.

Edge

  • 하드웨어 최적화 라이브러리: SSM을 다양한 하드웨어 환경에 맞게 최적화합니다.

Rene

  • 컴팩트 언어 모델: 소형 언어 모델로, 다양한 디바이스에서 효율적으로 작동하도록 설계되었습니다.

💰 Cartesia의 성장과 투자 유치

Cartesia는 최근 Index Ventures가 주도한 시드 라운드를 통해 2200만 달러를 유치하며 총 2700만 달러의 투자를 확보했습니다.

주요 투자사:

  • Index Ventures
  • A* Capital
  • General Catalyst
  • Lightspeed
  • SV Angel

투자금 활용:

  • 팀 확장 및 연구 개발 강화
  • 다양한 애플리케이션을 위한 멀티모달 AI 모델 개발
  • Edge 및 Sonic On-Device와 같은 하드웨어 최적화 기술의 고도화

⚖️ 윤리적 문제와 해결 노력

Cartesia는 연구 및 제품 개발 과정에서 저작권 데이터 사용보안 관련 논란에 직면했습니다.

  • 데이터셋: 일부 모델은 저작권 도서가 포함된 The Pile 데이터셋으로 훈련되었으며, 이로 인해 법적 문제가 제기될 가능성이 있습니다.
  • 음성 복제 도구: Sonic의 음성 클론 기능은 악용될 가능성이 있어 추가적인 안전 장치가 필요합니다.

Cartesia는 이에 대해 다음과 같은 조치를 취하고 있습니다:

  1. 음성 인증 및 워터마킹 시스템 개발 중
  2. 외부 감사와 협력: 독립된 외부 기관과 협력하여 모델의 안전성과 신뢰성을 검증

🌐 시장 전망과 경쟁

Cartesia는 기존 AI 아키텍처의 대안을 제시하며, 고객 서비스, 로보틱스, 마케팅 등 다양한 분야에서 활용될 가능성을 열고 있습니다.

  • Sonic은 API 응답 속도가 90ms 이하로 경쟁사 대비 4배 더 빠른 성능을 자랑하며, 주요 고객인 Goodcall을 비롯한 다수의 기업에서 사용되고 있습니다.
  • 미래 비전: 텍스트, 이미지, 비디오 등 모든 데이터를 실시간으로 이해하고 생성할 수 있는 멀티모달 AI 모델 개발

경쟁사:

  • Zephyra, Mistral, AI21 Labs: 하이브리드 Mamba 모델 개발
  • Liquid AI: 자체 아키텍처 개발

✨ 마무리: AI 기술의 새로운 가능성을 열다

Cartesia는 SSM 기반 AI 모델로 높은 효율성과 확장성을 제공하며, AI 비용 문제를 해결할 가능성을 보여줍니다.
Karan Goel CEO는 다음과 같이 말합니다:
“Cartesia는 트랜스포머 의존도를 줄이고, 빠르고 효율적인 AI 애플리케이션을 구축할 수 있는 새로운 가능성을 열고 있습니다.”

AI 기술의 한계를 극복하고 혁신을 이끌고 있는 Cartesia의 도전에 주목해보세요! 😊

728x90
반응형