• |
  • 記事

  • |
  • 映像メディアの価値を映す Scree...

映像メディアの価値を映す Screens

書かれた 沿って notbook

■「音声認識テキストをセカンドスクリーンに配信」NHKの実験事例

続いてNHKの佐藤氏が、同局における放送字幕生成への取り組みを紹介した。

映像メディアの価値を映す Screens

現在NHKで用いられている生放送での字幕入力法は、複数人のオペレーターが専用仕様のキーボードを使って速記入力する「一般キーボードリレー方式」、放送での発話を担当者が聞き取って名称に発話し直し、これをオペレーターが速記入力する「リスピーク方式」、番組音声を直接音声認識して文字に変換する「ハイブリッド方式」、そして番組音声の認識結果から原稿を推定する方式の4種類。「一般キーボードリレー方式」は主に歌謡・情報・報道番組にて、「リスピーク方式」はスポーツ・情報番組にて、「ハイブリッド方式」は大都市圏の拠点局発のニュース番組、番組音声の認識結果から原稿を推定する方式は一部ローカル局のニュース番組にて用いられているという。

2018年2月に総務省が策定した『放送分野における情報アクセシビリティに関する指針』では、県域局において「2027年度までに対象の放送番組80%以上に字幕付与」という目標が提示された。

NHKでは県域放送を行なうローカル放送局を多数抱えているが、佐藤氏は「各局ごとに字幕オペレーターを配置したり、設備を整備したりすることは現実的ではない」と。そのため、解決策として「県域局の番組音声をクラウドで音声認識し、認識結果をそのままセカンドスクリーンに配信することで字幕放送の代用とする方式を提唱し、実証実験を行っている」という。

実験対象となっているのは、平日夕方にNHK福島・静岡・熊本の放送局が制作するローカルニュース枠。WEBベースの字幕表示システムを用いて、聴視覚にハンディキャップを持つ視聴者と一般視聴者において「どの程度正確な文字が出力できるか」「音声の誤認識がある字幕がどの程度許容されるか」「セカンドスクリーンでの視聴はどの程度許容されるか」といった反響を調査している。実験期間は2019年2月初頭から8月末までの予定で、「字幕に対して一定の誤りが許容されると判断できればサービス化を検討する」という。