2026/05/04

つないでみよう:#29)画像生成 ChatGPT Image

先日と言っても 4 月の初め、OpenAI 社から案内メールがありました。前回までこの連載で紹介していた画像生成 AI の DALL-E3 のサービスが、2026 年 5 月 12 日に終了とあります。今後は最新のフラグシップモデルである GPT Image の利用を検討してほしいとのことです。

しばらくこのあたりのウォッチをサボっていたので、改めて調べたことをまとめておきます。


GPT Image の特徴

旧世代の AI である DALL-E は「画像生成専用モデル」だったのですが、GPT Image はマルチモーダル大規模言語モデル(LLM)との連携を前提にしたモデルで、

  • 会話しながら画像を修正
  • 画像内容を理解
  • 画像編集
  • 高度な指示追従

が得意です。単に画像を生成するだけではなく、指示を追加して調整したり、一部分だけ変更したりできるようです。面白そうなのでいずれ挑戦してみたいですね。


GPT Image API の使い方

前回からの流れで、まずは単純な画像生成について確認します。API のヘルプは こちら

エンドポイントは ”/images/generations” となっていて DALL-E3 と変わりませんね。

そしてサンプルの JSON を確認します。model が "gpt-image-1.5" になっていますが、prompt で作成する画像を指示するなど、構造も同じに見えます。

ちなみにヘルプによると、現時点で指定できるモデルは、

  • gpt-image-1
  • gpt-image-1-mini
  • gpt-image-1.5

の 3 種類の記載があります。そして、この連休中に 2.0 の案内が届きました。すごい勢いで進化しているようですね。


DALL-E3 とは少し違う

どうやら使い方は変わっていないようなので、前回までに作成した DALL-E3 用のサンプルをモデル名だけ変更して実行してみました。すると、次の部分でエラーが発生しました。

レスポンスの JSON が空っぽだったようです。デバッガで確認しても NotesJSONNavigator クラスは中身がほぼ表示されないので、調査しようがありません。

そこで Postman で確認してみるとすぐに原因がわかりました。API ツールって便利ですね。

response_format が unknown_parameter だとエラーが出ています。改めてヘルプを確認すると記載がありました。GPT Image モデルではサポートされていないパラメータだそうです。デフォルトが base64 なので、削除するだけでよさそうです。

同様に quality の設定にも変更がありました。DALL-E3 では "hd" と "standard" が指定できましたが、GPT Image では "high"、"medium"、"low" に変更されており、間違えてしているする同様のエラーとなります。

モデルによって送信する JSON が変わるんですね。インプリ前に仕様の確認とテストは必須のようです。エンドポイントが同じなので油断してしまいました...。


コードの修正

仕様が明確になったので #26 で作成した関数を GPT Image モデル用に修正します。model と quality にセットする値を修正し、response_format を削除します。

Function xGetJSON(vnd As NotesDocument) As String
   Dim jnav As NotesJSONNavigator
   Dim s As String

   'RequestBody(JSON) の準備
   Set jnav = xns.CreateJSONNavigator("")

   '1.model
   Call jnav.AppendElement("gpt-image-1.5","model")
   '1.size
   Call jnav.AppendElement("1024x1024","size")
   '1.quality
   Call jnav.AppendElement("low","quality")
   '1.response_format
   'Call jnav.AppendElement("b64_json","response_format")
   '1.prompt
   Call jnav.AppendElement(vnd.Prompt(0),"prompt")

   xGetJSON = jnav.Stringify
End Function

実行すると無事画像が生成されました。右側は  DALL-E3 で作成した画像なのですが、ずいぶんきれいになっていますね。


まとめ

今回は ChatGPT Image について紹介しました。

旧バージョンの画像生成 API とほぼ同じ仕様となっているのでプログラムはそのまま利用できます。ただ、パラメータの変更など若干の仕様変更がありますので注意しましょう。


前回 連載:つないでみよう


0 件のコメント:

コメントを投稿