音声→テキストに変換する方法

Taiyo · 2022 年 2 月 28 日午前 9:14

・前提条件 実装したい機能としてはtext to speech API（または、amivocieというツールのAPI）を用いた音声認識ツールです。現状は、音声ファイルからテキスト化をすることはできるのですがストリーミング音声認識(リアルタイム)を行いたいと考えております。
そこでドキュメントを見たところ下記画像のように「ストリーミングはgRPCしか対応できません」と記載されています。bubbleではg RPCを用いたAPI連携は可能なのでしょうか？

また、別の方法で実装された方がいらっしゃいましたらご教示いただきたいです。

試したこと

*ファイルからの音声認識を行いました。
エディターリンク(Amivoice-demo-app | Bubble Editor)
gif動画(キャプチャ動画 - eb8dbffc79a46a5d91991bbbb513d457 - Gyazo)

ドキュメントです（Speech-to-Text リクエストの構成 | Google Cloud Documentation

NoCodeNinja · 2022 年 3 月 1 日午後 8:42

自分が知る限りですが、BubbleのAPI ConnectorではgRPCに対応していない可能性が高いですね
他のストリーミング音声認識の方法を探る必要があり、ツール探しと検証が必要ですが今のところ自分は存じていません、お力になれず申し訳ないです。

yukikun · 2022 年 3 月 2 日午前 8:33

gRPC形式での処理は試したことがないので、もしできるとしたら・・・のレベルですが、
独自Pluginとしてサーバーサイドにnode.jsでgRPCをインストールして構築することになると思います。
が、protファイルが作れるのか、サーバー側のディレクトリをどうするかなどハードルは非常に高いと思われます。

Taiyo · 2022 年 3 月 2 日午前 9:41

ご返信くださりありがとうございます！
別のツールを探してみます！

NoCodeNinja · 2022 年 3 月 2 日午後 4:00

はい、ぜひです。
ゆきくんさんも、ありがとうございます！！！

Taiyo · 2022 年 3 月 3 日午前 10:06

ご返信遅れてしまい申しわけございません。

yukikunさんもありがとうございます。試してみます！

トピック		返信	表示
BubbleにおけるWhisper API利用時の「Open AI error: the parameter file cannot be empty」エラーについて bubble	4	123	2023 年 6 月 30 日
ランダムマッチした人と音声通話する機能を実装したいです bubble	5	190	2022 年 12 月 25 日
NoCodeTool のツール選定に関して質問したいです。言語学習アプリのMVPを作成したいのですが...... ツール選定に関する質問 api関連	1	227	2021 年 2 月 2 日
bubbleにおける文字認識機能 bubble	3	263	2023 年 6 月 4 日
bubbleから動画ファイルをアップロードした上でその動画をtext(to string?)にしてか...... bubble api関連	1	220	2021 年 2 月 2 日

音声→テキストに変換する方法

試したこと

ドキュメントです （Speech-to-Text リクエストの構成 | Google Cloud Documentation

関連トピック

ドキュメントです（Speech-to-Text リクエストの構成 | Google Cloud Documentation