|
音声合成ソフト |
APPLICATION INFORMATION
2011-No.6 |
|
|
|
|
|
|
音という物理現象が科学対象として認知され始めて以来、機械的に音を作成するという試みが始まりました。この音合成技術の1つとして、人工的に人間の声を再現するという研究が古くから行われており、現在では一般的なPCでも精度の高い音声合成が可能です。また近年では、音声合成という専門的な研究技術から一歩踏み出し、より身近で実用的になりつつあります。
ここでは、最先端の「音声合成ソフトウェア」について紹介します。
人間の声の合成には、大きく分けて連結合成とフォルマント合成という2つの手法がありますが、現在は連結合成が主流です。
連結合成は、近年に急速に発展した手法で、実際の声というアナログデータをPCM(Pulse
Code Modulation)方式などでデジタルデータへ変換・サンプリングし、それらのサンプリングデータを切り貼りする方式です。個々のサンプリングデータの連結方法次第では非常にクオリティの高いものにできます。膨大なサンプリングデータの管理・運用や高速・高度なデジタル処理が必要な合成方式ですが、ストレージやメモリ、CPUなどのハードウェアの発展と、コーパスなどで注目を集めている言語学分野の発展に支えられています。
近年最も大きく進歩している点は、文章の品詞や文節を理解させ、文字データをそのまま音読できるものが登場している点です。これによって、単に特定の文字列を任意の音で発音させるだけでなく、文章を音読させる事が可能になり、また内容も原稿を差し替えるだけで対応可能です。
また合成自体がデジタル化されている事もあり、読み上げのニュアンス等も詳細に調整できます。
代表的なソフトウェアには、ボイスソムリエ ネオ(日立ビジネスソリューション)、Voice
Text(HOYA)、AI Talk(WebDemo)などがあります。またWindowsではSAPI(Speech
Application Programming Interface)という音声合成コンポーネントが標準で用意されている他、SofTalk、OpenJ
talk(NAIST)などのフリーウェアも有名です。
文章の読み上げという需要は幅広くありますが、近年では利用用途や形態に、より広がりが見られます。詠太(JUST
SYSTEM)は、一般的な文章読み上げ機能のほかに、JUST Suiteアプリケーションとスムーズに連携することができ、ビジネス用途での利用浸透が図られているほか、ToSpeak
Online(東芝)のように、任意の文章の音声ファイルをweb上で生成する、クラウドサービスも登場しています。弊社でも、UC-win/Roadを用いたドライブシミュレータ上での案内読み上げ時などに、活用しています。
|
|
※社名、製品名は一般に各社の登録商標または商標です。 |
|
(Up&Coming '11 晩秋の号掲載) |
|
|
>> 製品総合カタログ
>> プレミアム会員サービス
>> ファイナンシャルサポート
|