問題
こんにちは
Gemini Pro Visionについて、画像から問題と答えを抽出する機能を作りたいのですが、AI StudioやPoeでは期待通りの応答が返ってくるのですが、API経由だとAI Studioとは違った、間違った応答が返ってきてしまいます。
例えば下記の画像から問題と答えを抜き出すように指示すると、AI Studioでは全て問題なく出力されるのですが(画像2)、PostmanやFlutterFlowを使ってAPI経由でリクエストした場合、半分くらい問題または答えが違うものが出力されてしまいます(画像3)。
Temperatureなどのパラメータはどちらも同じです。
画像のエンコードはこちらのサイトなどを使用しました。
モデルはAI Studioではpro-vision-001, postmanではpro-vision-latestを使用していますが、ドキュメントを読む限りlatestは"001"を意味していて、画像4枚目のようにAPI経由で確認しても"001"のことを指しているようでした。
もちろんテストはいろんな画像を使って何度も行っていますが、毎回APIで行った時だけ間違いが起きてしまいます。
APIの時に応答の質が下がる原因について、何か知っていることなどありましたら教えていただければ幸いです。
何卒よろしくお願いいたします。
スクリーンショット
問題の画像(GPTで適当に生成しました)
画像2: AI Studioの結果(ほぼ全てあっています)
画像3: postmanでの結果(読みにくくて申し訳ないのですが、間違いが多いです。)
画像4: APIで確認したGeminiのバージョン
3日以上回答が付きませんね。
これは運営Botです。なかなか回答が付かない場合には、
質問フォーマットに沿って質問をすることで、回答が得られるかもしれません。
以下のフォーマットを参考にしてください
スキルに関係なく自由に投稿下さい
- *質問者の方は、**あとの方が読みやすいように、回答者が推測しやすいようにするためわかりやすいタイトルや画像などを多めに張り付けるようにしてください。また、質問に回答してもらった場合には、一言でも”お礼”を言っていただければ、回答者の励みになります。
質問の範囲
ノーコードツールに質問のある範囲でお願いします。Javascript,Flutter などのコーディング要素が含まれていた場合には回答しきれない可能性があります。
質問テンプレートに沿って投稿いただくと回答いただける可能性があがりますので、なるべく詳細を記入するようにしてください。回答する方にわかりやすいよう質問文章も整理して投稿下さい。
質問には、少し下にあるテンプレートを使って下さい。
回答者の方は、 スキルは問いません。どんな方が回答いただいても結構です。交流や質問者の気づきになれば良いので、積極的にコメント下さい。アウトプットすることで勉強になることも多いはずです。
免責事項
本スレッドは、NoCodeCampのオンラインサロンの管理ですが、回答を保証したり、正確性を担保することはできません。サロン生の交流を目的とした質問回答となります。
以下に関する質問には、回答がつかない可能性があります。
・案件に関する要件定義
・バックグラウンドがわからない
たくさんの回答が欲しい場合には、構築人材の紹介もしてます
その他、急ぎや対応や、構築の支援が欲しいときはありませんか?
例えば、業務案件で、すぐに回答が必要の場合には、人材紹介事業を検討下さい。
NoCodeCamp人材紹介
質問者のテンプレート
以下は、投稿する人のためのテンプレートです。
必要のない項目は、削除下さい。
###・前提条件・発生している問題・エラーメッセージ ・実装したい機能
スクリーンショット
- できれば、全体が分かるようにスクリーンショットを載せてもらえれば助かります。