Item type |
会議発表論文 / Conference Paper(1) |
公開日 |
2023-03-07 |
タイトル |
|
|
タイトル |
Contextual Attention を用いたスペクトログラムの復元 |
タイトル |
|
|
タイトル |
Recovering Spectrograms using Contextual Attention |
|
言語 |
en |
その他(別言語等)のタイトル |
|
|
その他のタイトル |
Contextual Attention オ モチイタ スペクトログラム ノ フクゲン |
言語 |
|
|
言語 |
jpn |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者 |
羽原, 俊輔
黒澤, 義明
目良, 和也
竹澤, 寿幸
HABARA, Shunsuke
KUROSAWA, Yoshiaki
MERA, Kazuya
TAKEZAWA, Toshiyuki
|
抄録 |
|
|
内容記述タイプ |
Abstract |
|
内容記述 |
There is a growing trend towards implementing technologies that use deep neural networks to improve sound quality by signal denoising, and a system that converts voice quality in real-time for the online conference. In the field of computer vision, inpainting techniques based on deep neural networks have also been developed in recent years. In this paper, we focus on an inpainting technique with contextual attention to recover spectrograms. We apply a mask to the time direction of the spectrogram and examine whether the spectrogram can be recovered from the non-masked area. We propose a method to improve the accuracy of speech restoration by providing a gradient in the frequency direction to the spectrogram. As a result, our proposed method improved one of sound metrics: Mel-Cepstral Distortion. We also confirmed that the attention map improved attention in the frequency. |
内容記述 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
2021年度(第35回) : 2021年6月8日-6月11日 : オンライン 2Xin5-22 本研究の一部は国立研究開発法人科学技術振興機構(JST)の研究成果展開事業「センター・オブ・イノベーション(COI)プログラム」グラント番号JPMJCE1311の支援によって行われている |
書誌情報 |
人工知能学会全国大会論文集
巻 35,
p. 1-4,
発行日 2021
|
出版者 |
|
|
出版者 |
人工知能学会 |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA11578981 |
DOI |
|
|
関連タイプ |
isIdenticalTo |
|
|
識別子タイプ |
DOI |
|
|
関連識別子 |
info:doi/https://doi.org/10.11517/pjsai.JSAI2021.0_2Xin522 |
権利 |
|
|
権利情報 |
本著作物の著作権は人工知能学会に帰属します。本著作物は著作権者である人工知能学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」に従うことをお願いいたします。 |
関連サイト |
|
|
|
識別子タイプ |
URI |
|
|
関連識別子 |
https://www.ai-gakkai.or.jp/ |
|
|
関連名称 |
https://www.ai-gakkai.or.jp/ |
フォーマット |
|
|
内容記述タイプ |
Other |
|
内容記述 |
application/pdf |
著者版フラグ |
|
|
出版タイプ |
VoR |
|
出版タイプResource |
http://purl.org/coar/version/c_970fb48d4fbd8a85 |