【NAB Show 2013】独Fraunhofer研究所 音声も音響も一つのCODECで低ビットレート化 スピーチとオーディオに対応したExtended HE-AACを出展

2013.4.12 UP

Extended HE-AACのデモ

 独Fraunhofer研究所IIS部門(FhG/IIS)は、Extended HE-AACを出展した。この符号化方式は、音声と音響の両方に対応している。
 符号化方式には種々のものがあるが、音声用と音響用は原理が異なる。携帯電話などに使われる音声用符号化方式は、符号化側と復号側に辞書を持ち、入力がどの辞書情報に相当するかを送っている。そのため、PHSを除くほとんどの携帯電話では、音声はほぼ正確に伝えられても、楽曲などの音響は正確に伝えることはできない。最近のLTEではかなり改善されたが、携帯電話で楽曲を送ろうとするといまだに音としては奇妙なものになる。その代わりに辞書情報を中心に送るため、この方式はデータ量が少ない。
 一方、音響用符号化方式は、音声も音響も伝送できるが、ビットレートが高めになる。無理にレートを下げると、定位が定まらなかったり、ワウフラッターのような揺らぎが生ずる。
 FhG/IISが出展したExtended HE-AACは、従来のHE-AACv2の音声音響分離能力を強化したものである。HE-AACv2にも音声音響分離機能があり、それぞれに適した符号化を適用していた。しかし、両符号化器への分配割合は固定されており、最適化は図られていなかった。Extended HE-AACではこの分配を最適化したことで、ステレオで16kbps、モノラルで8kbpsまでレートを下げられる。多くの基本的な機能は、HE-AACv2に搭載されており、それゆえ「Extended」の名前が付けられているという。
 Extended HE-AACは、HE-AACv2比で約50%増の演算処理と約2倍のメモリで実現される。Extended HE-AACは、HE-AACv2までのAACデータの復号は可能であるが、HE-AACv2はExtended HE-AACのデータを復号できない(HE-AACv1は、限定的ながらHE-AACv2のデータを復号できる)。この方式は、すでにMPEG-Dで標準化されている。FhG/IISでは、HE-AAC全体の知財権をパッケージ化して販売する予定という。

#interbee2019

  • Twetter
  • Facebook
  • Instagram
  • Youtube