ChatGPTに新しいモデル「GPT-4o」が登場しました。読み方は「ジーピーティーフォーオー」で正式名称は「GPT-4omni」とのこと。ちなみにオムニ(Omni)は「すべての」という意味。


GPT-4oのポイントはこんな感じ。
- とにかく応答が高速
- テキスト・画像・音声・動画を同時に処理可能
- 人と同じ速度で会話が可能
- 音声認識機能で感情を持つような反応
- リアルタイムで動画を認識
- API利用料金が従来の半額
(ポストの翻訳)
音声、画像、テキストをリアルタイムで推論できる当社の新しい主力モデル、GPT-4o をご紹介します: http://openai.com/index/hello-gpt-4o/
テキストと画像の入力は API で本日から開始され、ChatGPT では音声とビデオが今後数週間以内に開始されます。
OpenAIの公式発表はこちら。
Just a moment...
(記事の要約)
OpenAIはGPT-4oを発表しました。このモデルはテキスト、音声、画像、ビデオをリアルタイムで処理し、より自然な人間とコンピュータの相互作用を目指しています。GPT-4oは音声認識と翻訳、視覚理解の分野で大きな進歩を遂げ、以前のモデルより高速で低コストです。また、安全性とユーザー体験の向上を重視しており、段階的に機能を展開します。

