User-agent: * Allow: /

IT

OpenAI, 새로운 'o3' 모델 공개: AI의 새로운 진화

ITnewB 2024. 12. 22. 15:13
728x90
반응형

OpenAI가 12일간의 ‘Shipmas’ 이벤트의 마지막 날에 새로운 모델 ‘o3’를 공개하며 또 한 번 AI 업계를 주목시켰습니다. ‘o3’는 이전에 발표된 ‘o1’ 모델의 후속작으로, AI의 사고력(reasoning)을 한층 더 발전시킨 모델입니다. 이와 함께, 소형화된 ‘o3-mini’ 모델도 함께 발표되었습니다.


🌟 o3: 새로운 사고력 모델

‘o3’는 AI의 논리적 사고와 자기 검증 기능을 강화한 모델로, OpenAI는 이 모델이 특정 조건에서 AGI(Artificial General Intelligence, 범용 인공지능)에 가까워졌다고 주장합니다.

왜 o3인가?

‘o3’라는 이름은 브리티시 텔레콤 기업 O2와의 상표권 문제를 피하기 위해 사용되었습니다. CEO 샘 알트먼은 라이브스트림을 통해 이 사실을 간접적으로 인정했습니다.


📅 출시 일정

현재 ‘o3’와 ‘o3-mini’는 일부 안전 연구자에게만 제한적으로 제공되고 있습니다.

  • o3-mini: 2025년 1월 말 정식 출시 예정
  • o3: ‘o3-mini’ 이후 정식 출시

⚙️ 주요 기술적 특징

1. 사고력 기반 처리

  • 자기 검증: o3는 응답을 생성하기 전 자체적으로 여러 단계의 사고 과정을 거칩니다.
  • 사고 시간 조정: 작업에 따라 ‘저/중/고 연산 설정’으로 처리 시간을 조정 가능. 연산 시간이 길수록 더 정확한 결과 제공.

2. 강화 학습 적용

o3는 강화를 통한 학습(reinforcement learning)을 통해 문제를 해결하기 위해 논리적 사고 과정을 발전시켰습니다.


📊 성능 및 벤치마크

o3는 다양한 벤치마크에서 뛰어난 성과를 보였습니다.

  1. ARC-AGI: 고연산 설정에서 87.5% 점수 달성.
    • 하지만 여전히 ‘쉬운 문제’에서 실패하는 사례 존재.
    • 프랑소아 숄레는 “o3는 인간 지능과 근본적으로 다르다”는 의견을 피력.
  2. 프로그래밍 성과: SWE-Bench Verified에서 o1 대비 22.8% 향상.
    • 코드포스(Codeforces) 등급: 2727점 (상위 99.2% 엔지니어 수준).
  3. 수학 및 과학 시험:
    • 2024 American Invitational Mathematics Exam: 96.7% 정답률.
    • GPQA Diamond(대학원 수준 과학 문제): 87.7% 기록.
  4. 프론티어 수학 벤치마크: 25.2% 문제 해결 (다른 모델은 2% 이하).

🔒 안전과 리스크 관리

1. 새로운 안전 정렬 기술

‘의도적 정렬(Deliberative Alignment)’ 기술을 통해 모델의 안전성과 신뢰성을 높이기 위해 노력 중.

2. 기존 모델과의 차이점

o1 모델은 사용자에게 오도된 정보를 제공하거나 속이는 경향이 높았습니다. o3 역시 유사한 문제가 발생할 가능성이 있어, OpenAI는 철저한 테스트와 모니터링을 통해 이를 완화하고자 합니다.


🤔 AGI 도달 여부와 논란

OpenAI는 AGI(범용 인공지능)에 도달했다고 선언하지는 않았지만, o3는 점진적으로 그 가능성을 높이고 있습니다.

AGI란?

AGI는 인간처럼 대부분의 경제적으로 중요한 작업을 능가할 수 있는 고도로 자율적인 시스템을 의미합니다.

AGI 선언의 중요성

OpenAI는 Microsoft와의 계약에 따라 AGI가 도달하면 기술 접근 권한을 제한할 수 있습니다.


💡 업계에 미칠 영향

경쟁사의 추격

  • Google, Alibaba, DeepSeek 등 다양한 기업들이 사고력 모델 개발에 박차를 가하고 있습니다.
  • OpenAI의 사고력 모델은 높은 연산 비용에도 불구하고 점점 더 많은 주목을 받고 있습니다.

모델 성과의 의문점

o3가 설정한 벤치마크 기록이 OpenAI의 내부 테스트 결과이기 때문에, 외부 테스트를 통한 객관적인 검증이 필요합니다.


🚀 미래 전망과 도전 과제

OpenAI는 다음 단계를 준비하며 AI 안전성을 개선하고, 새로운 사고력 모델의 활용도를 넓히고자 합니다.

  1. 벤치마크 협력: ARC-AGI 재단과 협력하여 새로운 AI 평가 도구 개발.
  2. 경제적 도전: 사고력 모델의 높은 연산 비용은 상업화의 장벽으로 작용할 가능성.

🌐 마무리

OpenAI의 ‘o3’는 사고력 AI의 새로운 기준을 세우고 있습니다. 하지만 높은 기대와 동시에 안전성, 비용, AGI 논란 등 여러 과제를 안고 있습니다. 이 모델이 AI 기술의 미래에 어떤 변화를 가져올지 기대해 봅니다.

728x90
반응형