【NEWS】パナソニック AI文字認識技術による文字起こしクラウドサービス「P-VoT」 年内商品化へ向けβサービスを開始
2019.7.2 UP
クラウド上の音声認識で自動的に文字起こしをするサービスP-VoT
パナソニックはP-VoTを業務効率化へ向けたサービスの一環と位置づけている
パナソニックは6月13日、文字起こしサービスP-VoT(ピーボット)のβ(ベータ)サービスを開始。申込受け付けを開始した。
P-VoTは、音声認識技術により、現行の文字起こしをサポートするソリューションサービス。具体的には、動画・音声ファイルを、パナソニッククラウドサービスにアップロードすることで、高精度の音声認識により、幅広いジャンルの文字起こしを実施する。
P-VoTは、クラウド上でファイルを共有できるため、記者が局に戻る前に、他のスタッフが文字起こしの結果をもとに修正・編集が可能。クラウド上で設定した登録ユーザーのみに結果通知を行い、登録ユーザーがクラウドにアクセスして確認・修正を行うため、誤送信などの人的なミスによる情報の漏洩が少なく、安全性が高い。登録ユーザーは、ネットに接続したブラウザーから修正ができるため、特別な機器なども必要なく、利便性が高い。また、チームでの分担作業などもクラウドを用いて実施できる。
特徴は、以下の4点。
(1)AIを用いた高精度音声認識による文字起こし
DNN(ディープ・ニューラル・ネットワーク)技術を用いた高精度音声認識を採用している。幅広いジャンルの文字起こしに対応しており、特に放送向け辞書が充実しているという。
(2)インターネットブラウザで利用可能
インターネットに接続されたブラウザーがあれば、特別な機器の導入は必要なく、スマホでも操作が可能。
(3)効率的な修正インタフェース
映像・音声と連動させて文字起こし結果を確認・修正できる。シーク作業の煩わしさを削減する。プレビュー再生、マーキングなど、GUIによる使いやすい機能が搭載されており、効率的な編集作業が可能。
(4)グループ管理による複数人の修正・編集に対応
番組ごとに複数人で確認・編集するチーム運用にも対応する。
正式商用化は2019年中を予定しており、これまで実施してきたαサービスの結果をもとに、正式商用化へ向けたβサービスを開始する。申込みは、申込書に必要事項を記入後、営業担当者へ問合せをした上で、アカウントの発行手続きに入り、利用開始となる。
6月13日に開催したプレス向け説明会では、P-VoTをパナソニックの業務プロセスイノベーション(業務プロセス効率化)の一環と位置づけて説明した。パナソニック システムソリューションズ ジャパン 株式会社 パブリックシステム事業本部 システム開発本部 統括部長の梶井孝洋氏は、帝国データバンクの意識調査アンケートなどをもとに、放送業界における人材不足が課題となりつつあることを指摘し、「放送業界の業務プロセスイノベーションパートナーとして貢献していきたい」と述べた。
従来、取材の記事化やアーカイブのメタデータ付けや会議の議事録作成などは、人手が必要で、通常、実時間の3-6倍の時間がかかり、コストも時間も必要だったのが現状。この部分の改善を主目的としてP-VoTを商品化する。
αサービスとして、試験運用を実施した結果、利用者からは、次のような感想を得ることができたという。
<感想1>「15分弱の屋外でのインタビューを5分程度で一時作業を終了できた」
<感想2>「入力で修正を加えることが前提でもあるが、完全に書き起こされているところもある」
<感想3> 「ゼロから文字起こしするよりは楽、素材アップロードから結果がでるまでが早い、自力起こしよりはるかに効率的などの肯定的な意見が多く寄せられている」
<感想4>「AIが起こしたものを学生アルバイトに聞き直して修正してもらえることで自力起こしよりもあるかに効率的な仕事ができた」
<感想5>「コスト的に考えても『専門業者に緊急発注するほどではないが、一応内容を把握しておきたい素材』を『P-VoT+学生アルバイト」で起こすのは大いにアリだと感じた」
パナソニックでは今後、同社の放送、映像制作機器やシステムと連携することで、シームレスな運用ワークフローの構築を予定しているという。
【問い合わせ先】
パナソニック システムお客様ご相談センター 0120-878-410
(9:00-17:30、土日祝日は受付のみ)
クラウド上の音声認識で自動的に文字起こしをするサービスP-VoT
パナソニックはP-VoTを業務効率化へ向けたサービスの一環と位置づけている