OpenAI社が新しいモデル GPT-4oを発表

最新情報

ChatGPTに新しいモデル「GPT-4o」が登場しました。読み方は「ジーピーティーフォーオー」で正式名称は「GPT-4omni」とのこと。ちなみにオムニ(Omni)は「すべての」という意味。

GPT-4oのポイントはこんな感じ。

  1. とにかく応答が高速
  2. テキスト・画像・音声・動画を同時に処理可能
  3. 人と同じ速度で会話が可能
  4. 音声認識機能で感情を持つような反応
  5. リアルタイムで動画を認識
  6. API利用料金が従来の半額

(ポストの翻訳)
音声、画像、テキストをリアルタイムで推論できる当社の新しい主力モデル、GPT-4o をご紹介します: http://openai.com/index/hello-gpt-4o/
テキストと画像の入力は API で本日から開始され、ChatGPT では音声とビデオが今後数週間以内に開始されます。

OpenAIの公式発表はこちら。

Just a moment...

(記事の要約)
OpenAIはGPT-4oを発表しました。このモデルはテキスト、音声、画像、ビデオをリアルタイムで処理し、より自然な人間とコンピュータの相互作用を目指しています。GPT-4oは音声認識と翻訳、視覚理解の分野で大きな進歩を遂げ、以前のモデルより高速で低コストです。また、安全性とユーザー体験の向上を重視しており、段階的に機能を展開します。