Re: 講義の字幕化システム



中根さん、皆様。伊藤@長野大学です。
日本IBMとの共同プロジェクトにおける当事者です。(^^;
音声認識はビアボイスを使いますので、どんな状況かはご推測できるかと思います。

今回のプロジェクトについて記事では明確に述べられていませんが、音声認識だけでは
正しい日本語文章にはならないことは明らかです。しかし、できるだけリアルタイムに
聴覚障害学生へ教員の音声を文字として提供することが必要であることから、誤変換に
ついては間違いがあってもそのまま表示し、授業終了後における後処理において、効率
よく文字情報の修正が可能な字幕編集ソフトと、その結果をSMILへ自動変換し、適宜
サーバーにアップロードすることで、e-Learningのためのコンテンツ作成が容易に可能
となることを主眼として開発したシステムを実証をすることあります。

 基本は聴覚障害学生への授業支援(ノートテイクにおける情報保障との差についても
調査することになります)ですが、ノートをとることが困難な肢体不自由学生や、
ロービジョンなどの視覚障害学生、さらには授業を欠席した一般学生の復習に もつながる
ものだと思います。(学内LANからのみアクセス可能としますので、外部からは見る事が
できません。あしからず。)
しかし、授業終了後におこなうことが必要な後処理がどれほどの作業量になるのか、
授業担当教員の負担はどれほどのものなのか、など、実際にやらないとわからない事も
多いと思いますので、今後の実証で明らかにしていきたいと思います。


At 0:55 PM +0900 05.3.15, Masafumi NAKANE wrote:
中根です。

asahi.com から

----------
大学の講義、すぐ字幕に 日本IBM
http://www.asahi.com/business/update/0315/042.html
----------

記事では、 8割から 9割の精度とされていますが、実際のところどれくらい使
い物になるのか興味深いですね。当然話者によっても結果の品質には差が出て
くると思いますが、それなりの品質が確保できるようなら、ネットワーク上で
提供されている遠隔教育用のコンテンツなどの作成に応用することなども考え
られるでしょうから、今後に期待したいと思います。

ただ、記事からは導入コストがどのくらいなのかが分からなかったので、その
点がちょっと気になります。

ところで、 asahi.com といえば、以下のような記事もありました。

----------
asahi.com、音声読み上げソフトを無料配布
http://www.itmedia.co.jp/news/articles/0503/14/news051.html
----------

まだこのソフトウェアに関しては試してみていませんが、どうやらこのソフト
ウェアがインストールされている PCでasahi.comにアクセスすると、内容を読
み上げてくれる、というもののようです。この手のソリューションは、
asahi.com が導入した富士通のものの他にも、 IBMかどこかのものもあり、これを導
入しているサイトもそれなりの数あると思いますが、こちらの方も私自身はま
だ試してみていません。

それで、上の字幕の記事を見に行って気づいたのですが、 asahi.comのページ
は、昔は <h?> 要素が全然なかったために、読み飛ばしが結構めんどくさかっ
たのですが (まあ、ちゃんと対応策はありましたが) 、今は記事の本文の直前
にある見出しが <h?> 要素になっているようです。まだこれ以外の変更点につ
いては詳しく見ていませんが、この読み上げソリューションの導入と同時に、
これまでよりもアクセシビリティに配慮した作りにしたのかもしれません。

こうして読み飛ばしが簡単にできるようになることはありがたいですが、サイ
ト運営者の立場からすると、こうすることで広告まできれいさっぱり読み飛ば
されてしまうわけで、それはそれで彼らにとっては困った問題なのかもしれな
いな、などと思いました。

中根雅文

--
   Eiichi ITO, Ph.D.
< ito@xxxxxxxxxxxx>
 Nagano University