Item type |
会議発表論文 / Conference Paper(1) |
公開日 |
2023-03-07 |
タイトル |
|
|
タイトル |
画像変換手法による音声強調のためのスペクトログラム変換 |
タイトル |
|
|
タイトル |
Spectrogram Transforms for Speech Enhancement by Image-to-image Translation |
|
言語 |
en |
その他(別言語等)のタイトル |
|
|
その他のタイトル |
ガゾウ ヘンカン シュホウ ニヨル オンセイ キョウチョウ ノ タメノ スペクトログラム ヘンカン |
言語 |
|
|
言語 |
jpn |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者 |
黒澤, 義明
目良, 和也
竹澤, 寿幸
KUROSAWA, Yoshiaki
MERA, Kazuya
TAKEZAWA, Toshiyuki
|
抄録 |
|
|
内容記述タイプ |
Abstract |
|
内容記述 |
We aimed to examine well-known image-to-image translation technique, so-called pix2pix based on deep neural networks. Focusing on time-frequency analysis and implementing auxiliary classifier generative adversarial networks (ACGAN), we estimated the transform performance of spectrograms for sound enhancement. As a result using an image index, SSIM, we confirmed to slightly improve its performance compared to the original research. |
内容記述 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
3Rin4-59 本研究の一部は国立研究開発法人科学技術振興機構(JST)の研究成果展開事業「センター・オブ・イノベーション(COI)プログラム」グラント番号JPMJCE1311の支援によって行われている。また、広島市立大学特定研究費(先端学術研究費H27~29,30年度科研費獲得支援費)の支援を得ている。 |
書誌情報 |
人工知能学会全国大会論文集
巻 34,
p. 1-4,
発行日 2020
|
出版者 |
|
|
出版者 |
人工知能学会 |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA11578981 |
DOI |
|
|
関連タイプ |
isIdenticalTo |
|
|
識別子タイプ |
DOI |
|
|
関連識別子 |
info:doi/https://doi.org/10.11517/pjsai.JSAI2020.0_3Rin459 |
権利 |
|
|
権利情報 |
本著作物の著作権は人工知能学会に帰属します。本著作物は著作権者である人工知能学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」に従うことをお願いいたします。 |
関連サイト |
|
|
|
識別子タイプ |
URI |
|
|
関連識別子 |
https://www.ai-gakkai.or.jp/ |
|
|
関連名称 |
https://www.ai-gakkai.or.jp/ |
フォーマット |
|
|
内容記述タイプ |
Other |
|
内容記述 |
application/pdf |
著者版フラグ |
|
|
出版タイプ |
VoR |
|
出版タイプResource |
http://purl.org/coar/version/c_970fb48d4fbd8a85 |