OpenAI社が新しいモデル GPT-4oを発表

最新情報

2025.10.29

ChatGPTに新しいモデル「GPT-4o」が登場しました。読み方は「ジーピーティーフォーオー」で正式名称は「GPT-4omni」とのこと。ちなみにオムニ（Omni）は「すべての」という意味。

GPT-4oのポイントはこんな感じ。

とにかく応答が高速
テキスト・画像・音声・動画を同時に処理可能
人と同じ速度で会話が可能
音声認識機能で感情を持つような反応
リアルタイムで動画を認識
API利用料金が従来の半額

Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqN

Text and image input rolling out today in API and ChatGPT with voice and video in the coming weeks. pic.twitter.com/uuthKZyzYx
— OpenAI (@OpenAI) May 13, 2024

（ポストの翻訳）
音声、画像、テキストをリアルタイムで推論できる当社の新しい主力モデル、GPT-4o をご紹介します: http://openai.com/index/hello-gpt-4o/
テキストと画像の入力は API で本日から開始され、ChatGPT では音声とビデオが今後数週間以内に開始されます。

OpenAIの公式発表はこちら。

Just a moment...

（記事の要約）
OpenAIはGPT-4oを発表しました。このモデルはテキスト、音声、画像、ビデオをリアルタイムで処理し、より自然な人間とコンピュータの相互作用を目指しています。GPT-4oは音声認識と翻訳、視覚理解の分野で大きな進歩を遂げ、以前のモデルより高速で低コストです。また、安全性とユーザー体験の向上を重視しており、段階的に機能を展開します。