音声→テキストに変換する方法

前提条件 実装したい機能としてはtext to speech API(または、amivocieというツールのAPI)を用いた音声認識ツールです。現状は、音声ファイルからテキスト化をすることはできるのですがストリーミング音声認識(リアルタイム)を行いたいと考えております。
そこでドキュメントを見たところ下記画像のように「ストリーミングはgRPCしか対応できません」と記載されています。bubbleではg RPCを用いたAPI連携は可能なのでしょうか?

また、別の方法で実装された方がいらっしゃいましたらご教示いただきたいです。

試したこと

*ファイルからの音声認識を行いました。
エディターリンク(Amivoice-demo-app | Bubble Editor)
gif動画(Screen capture - eb8dbffc79a46a5d91991bbbb513d457 - Gyazo)

ドキュメントです (Speech-to-Text basics  |  Cloud Speech-to-Text Documentation  |  Google Cloud

自分が知る限りですが、BubbleのAPI ConnectorではgRPCに対応していない可能性が高いですね:sweat_smile:
他のストリーミング音声認識の方法を探る必要があり、ツール探しと検証が必要ですが今のところ自分は存じていません、お力になれず申し訳ないです。

gRPC形式での処理は試したことがないので、もしできるとしたら・・・のレベルですが、
独自Pluginとしてサーバーサイドにnode.jsでgRPCをインストールして構築することになると思います。
が、protファイルが作れるのか、サーバー側のディレクトリをどうするかなどハードルは非常に高いと思われます。

「いいね!」 2

ご返信くださりありがとうございます!
別のツールを探してみます!

「いいね!」 1

はい、ぜひです。
ゆきくんさんも、ありがとうございます!!!:pray:

「いいね!」 2

ご返信遅れてしまい申しわけございません。

yukikunさんもありがとうございます。試してみます!

「いいね!」 1