OpenAI, GPT-4 Omni로 실시간 음성 대화 가능한 AI 발표 > 로컬 뉴스

본문 바로가기

로컬 뉴스

OpenAI, GPT-4 Omni로 실시간 음성 대화 가능한 AI 발표

페이지 정보

본문

총 50개국 언어를 지원하며 문자, 이미지, 음성을 모두 인식

사용자의 말투로 감정 식별

[사진 : OPEN AI 캡쳐]

OpenAI는 13일 월요일 샌프란시스코에서 열린 봄 시즌 업데이트에서 GPT-4 Omni(GPT-4o)의 음성 기능을 공개했다.

이 새로운 플래그십 모델은 실시간으로 인간처럼 말하는 친근한 AI 챗봇과의 대화가 가능하며, 영화 'Her'에서 AI 보조원의 목소리를 맡았던 스칼렛 요한슨을 연상시키는 목소리로 반응한다.

CTO 미라 무라티는 "GPT-4o는 GPT-4 수준의 지능을 제공하지만 훨씬 빠르다"며, "이는 협업의 미래로 나아가는 패러다임의 변화를 의미하며, 이 상호작용을 훨씬 자연스럽고 쉽게 만들 것"이라고 설명했다.

GPT-4o는 감정적인 어조로 대화하며, 때로는 흥분을 보이거나 웃음을 터뜨리기도 한다. 또한, 사용자의 말투로 감정을 식별할 수 있다.

GPT-4o는 텍스트, 비전, 오디오를 처리하는 여러 AI 모델 네트워크 대신 단일 모델로 모든 기능을 수행할 수 있어 모든 작업이 훨씬 빠르게 진행된다. 예를 들어, 사용자는 휴대폰 카메라로 수학 문제의 이미지를 보여주면서 동시에 모델과 대화할 수 있다.

이 기술은 다중 언어, 오디오, 비전 기능에서 획기적인 기준을 설정하며, GPT-4 수준의 지능을 운영한다.

OpenAI는 이 신기술을 macOS용 데스크톱 애플리케이션으로 출시할 예정이며, 유료 사용자는 오늘부터 이 앱을 사용할 수 있고, 무료 사용자에게는 향후 제공될 예정이다.

이번 데모는 AI 챗봇의 미래에 중대한 순간을 제시하며, 초기 챗봇이 겪었던 어색한 지연 문제를 넘어섰다.

OpenAI는 이번 시연으로 AI 혁신에서의 선도적 위치를 다시 한번 확인시켜 주었다.

이제 이 기술이 실제로 얼마나 효과적인지, 또는 무대 관리가 잘되어 오류를 피한 것인지 확인해야 할 시점이다.

댓글목록

등록된 댓글이 없습니다.

회원Login

회원가입
이번호 신문보기 더보기

시카고교차로소개 | 미디어 킷 | 광고문의 | 신문보기 | 관리자에게
Copyright (C) KOREAN MEDIA GROUP All right reserved.
HEAD OFFICE: 3520 Milwaukee Ave. Northbrook, IL 60062
TEL. (847)391-4112 | E-MAIL. kyocharo@joinchicago.com
전자신문 구독신청

Terms & Conditions | Privacy
Copyright © 2023 Kyocharo All rights reserved.
Developed by Vanple Networks Inc.
모바일 버전으로 보기

팝업레이어 알림