名古屋工業大学の国際音声言語技術研究所と株式会社テクノスピーチは、人間の声質・癖・歌い方をこれまでになく高精度に再現できるAI歌声合成システムの共同開発に成功したことを発表した。
音声合成・歌声合成技術の研究・開発に共同で取り組んできた名古屋工業大学とテクノスピーチは、これまでに、業務用カラオケ機器「JOYSOUND」や、音声創作ソフトウェア「CeVIO Creative Studio」等に、音声合成・歌声合成技術の導入を進めてきた。
本研究では、特定の歌唱者による約2時間の歌声データベースに対して、深層学習(ディープラーニング)等の統計的な機械学習技術、すなわちAI技術を適用することにより、歌唱者の声質・癖・歌い方を学習するシステムを開発した。学習した歌声を合成する際は、任意の歌詞付き楽譜を入力するだけでよく、人と区別ができないほどの超高品質なバーチャルシンガーの歌声が実現したという。本研究成果は、2019年3月に開催される、日本音響学会2019年春季研究発表会にて発表される。
テクノスピーチは、名古屋工業大学が中心となって開発した世界最先端の音声関連技術の普及を目的として設立されたベンチャー企業。同社と同大学は、本研究成果により、音声関連技術の提供・サービスのさらなる価値向上を目指していくとしている。
参考:【株式会社テクノスピーチ】AI技術により超高精度な歌声合成を実現~バーチャルシンガーの歌声は人と区別できない時代へ~