OpenAI에서 드디어 ChatGPT API와 Whisper API 공개했습니다.

반응형

오늘부터 새로운 ChatGPT 및 Whisper API로 앱과 제품을 구축할 수 있다고 합니다.
자세한 내용은 ChatGPT 및 Whisper API 소개에서 알아볼 수 있습니다.
 
기존 최신 모델인 text-davinci-003 사용료가 $0.0200였는데, 이번에 새로 출시된 ChatGPT에서 사용하고 있는 gpt-3.5-turbo 모델 사용료는 $0.002입니다.
성능은 더 좋아졌고 가격은 10배 싸졌습니다. 게다가 gpt-3.5-turbo 모델은 사용법과 생성 결과가 달라진것 같습니다.
gpt-3.5-turbo 모델 사용방법은 Chat completion - OpenAI API에서 확인해보세요.
 
그리고 Whisper 모델을 사용한 Speech-to-Text API도 출시했습니다.
Whisper API 가격은 $0.006/분이며 가장 가까운 초 단위로 반올림된다고 합니다.
타사에 비해서 가격이 매우 저렴해서 요것도 사용해볼 만한 것 같습니다.
특히 상황을 설명하는 프롬프트를 통해 맞춤형으로 성능을 개선할 수 있다고 합니다!
 
Whisper API 사용방법은 openai 파이썬 패키지를 사용하여 mp3를 전송하면 텍스트로 결과값을 받아볼 수 있습니다. 
요청하기

import openai

file = open("/path/to/file/openai.mp3", "rb")
transcription = openai.Audio.transcribe("whisper-1", f)

print(transcription)

응답 결과

{
  "text": "Imagine the wildest idea that you've ever had, and you're curious about how it might scale to something that's a 100, a 1,000 times bigger..."
}

 
이번에 공개된 ChatGPT API와 Whisper API를 사용하여 음성 인식 챗봇을 손쉽게 만들어 볼 수 있을 것 같습니다.

반응형