2019年であるのだが, つい興味を出してしまった. 全体の出費としてはキャプチャーボードの一万円だけで, それ以外は特に無い.
必要なのはキャプチャーボードと, あとは配信ソフト, それから配信されるためのもの. 配信されるものとは例えば Switch 上でプレイするゲームなど. そもそもそれが, 配信用PCの上で直接動かすならキャプチャーボードは不要. キャプチャーボードは他の機器の HDMI 出力を拾って来るためのものだから.
選ぶ点で重要なのは, 入力用のHDMIの穴が空いていること, パススルー出力があること. 入力用のHDMIの穴があってそこに例えば Switch などと繋ぐ. また USB3.0 くらいの穴が空いてて, それとPCを繋ぐことで, Switch の映像を PC が拾える. さて自分自身がゲームをする必要があり, 人間用にSwtichの映像を出力したいが, PCで拾った映像を見るとすると 500ms 程度どうしても遅延があって, とてもじゃないがゲームなど出来ない. ノベルゲームくらいならいいけど. というわけで, ただHDMIの映像をパススルーするだけの, パススルー出力というのが大抵のキャプチャーボードにはある. その穴と, 適当なディスプレイをHDMIケーブルで繋げば, Switch からの出力をただ流すことが出来る. ここに遅延はほとんど全然無い. 少なくとも感じられない.
というわけで私は "MiraBox" という名称で売られているものを Amazon で購入した. 恐るべきは, この商品は異なる名称でも売られている. それどころか, 値段が2万円だったり1万円だったりする. 私は1万円で買った. PCに繋いでみると, システム上は MiraBox として認識された. しかしキャプチャーボード自体には "BasicColor" というロゴが印刷されている...
見れるかわからないが Amazon リンクを貼っておく. これらは全て同一商品である!
一番安いとろこで買えば良いと思う. 知らんけど.
郷に入っては郷に従えだし, 長いものにはまかれろで OBS を使ってる. ググれば大抵の解決策は書いてある.
私は自分の声を入れるようなことはしてない. 人に聞かせたい声をしていないので. 代わりにといっちゃなんだが, 声を音声認識させてテキストにし, それを映像の下の方に合成して表示している.
Speech-to-Text の部分は驚くべきことに WebAPI がある. そしてそれを実際に実装してしまっている唯一のブラウザが GoogleChrome である.
これはただそれを使って聞き取ったテキストを表示するというだけの HTML ページとその周辺のコード. セキュリティの都合上, 「マイクの許可」というものをユーザーに, つまりあなたに毎回要求する. https だと, 許可が初回の一回だけで済む. というわけで https 化は実質的に必須である. 上のレポジトリには偽装 https 化するためのコードも一緒に入ってある. ブラウザで開くと, 署名が信用できないが良いかと聞かれるので, 危険を承知で開くを選択する必要がある. まあとにかく出来る.
で, これを開いたChromeのウィンドウをOBSの横に置いておいて, OBSの画面キャプチャ機能でそれを写している. いい感じにクロップして, また背景の白色をクロマキーで透過させるといい感じになる.
こんな感じになる