본문 바로가기
카테고리 없음

GPT-4o 실시간 대화를 위한 모델

by 리오넬메씨 2024. 5. 14.

GPT-4o 라이브 발표 및 기능 소개

 

OpenAI는 새벽 2시에 라이브 방송으로 GPT-4o 모델을 공개했습니다. 이 최신 모델은 기존 GPT-4의 지능을 갖고 있지만 응답속도가 훨씬 빠르며 텍스트, 음성, 비전까지 다양한 기능을 제공합니다. 특히, 한국어 처리 능력도 개선되어 더 적은 토큰을 사용합니다.

 

 

1. 라이브 발표 영상

 

실시간 대화 기능은 지연시간이 거의 없어 보이며 외국어 실시간 통역과 화상통화에 가까운 비전 인식 기능을 보여줍니다.

 

 

2. 실시간 대화: 강아지 Bowser

 

휴대폰 카메라를 통해 실시간으로 강아지를 인식하고 풍부한 감정을 담은 대화를 할 수 있습니다.

3. 실시간 대화: 다자간 화상컨퍼런스

 

화상채팅을 하는 4명의 인간과 한 명의 AI가 레이턴시 없이 자연스럽고 부드러운 대화를 이어가는데 목소리에 대한 칭찬과 회의 내용 요약이 돋보입니다.

 

 

4. 실시간 대화: AI끼리의 대화 + 상황인식 + 노래부르기

 

2명의 AI가 서로 대화하고 나중에는 노래를 부르며, 중간에 장난을 치는 직원이 나타나면 AI가 반응하는 장면을 보여줍니다.

 

 

GPT-4o 소개 자료 번역

 

GPT-4o는 실용성을 목표로 한 최신 딥러닝 모델로, 효율성을 개선하여 널리 제공됩니다. 오늘부터 ChatGPT에서 텍스트 및 이미지 기능을 롤아웃하며, 무료 등급과 Plus 사용자에게 최대 5배 더 높은 메시지 한도를 제공합니다. 몇 주 안에 ChatGPT Plus에 새로운 음성 모드가 알파 버전으로 롤아웃될 예정입니다. 개발자들은 이제 GPT-4o에 API를 통해 접근할 수 있으며, GPT-4 Turbo보다 2배 빠르고 가격은 절반, 속도 제한은 5배 더 높습니다. 몇 주 안에 소수의 신뢰할 수 있는 파트너에게 API를 통해 오디오 및 비디오 기능 지원을 시작할 계획입니다.

GPT-4o 기능 확장과 롤아웃

 

GPT-4o는 GPT-4 수준의 지능을 제공하며, 실시간 음성 대화와 실시간 비디오 처리 등의 새로운 기능을 제공합니다. ChatGPT는 오늘부터 이미지 이해와 논의를 포함한 GPT-4o의 기능을 무료로 제공하며, Plus 사용자에게는 더 많은 메시지 한도를 제공합니다. 새로운 음성 모드는 몇 주 안에 Plus 사용자에게 알파 버전으로 제공될 예정입니다.

GPT-4o API 및 가용성

 

개발자들은 이제 GPT-4o의 API를 통해 텍스트와 비전 기능을 활용할 수 있습니다. GPT-4o는 이전 모델에 비해 성능이 향상되었으며, API를 통해 제공되는 속도와 가격이 개선되었습니다. 앞으로 몇 주 안에는 API를 통해 오디오 및 비디오 기능도 제공될 예정입니다.