Item type |
会議発表論文 / Conference Paper(1) |
公開日 |
2023-03-07 |
タイトル |
|
|
タイトル |
深層学習を用いた画像変換に基づく会話からの音声抽出 |
タイトル |
|
|
タイトル |
Speech extraction from conversation based on image-to-image translation using deep neural networks |
|
言語 |
en |
その他(別言語等)のタイトル |
|
|
その他のタイトル |
シンソウ ガクシュウ オ モチイタ ガゾウ ヘンカン ニ モトズク カイワ カラノ オンセイ チュウシュツ |
言語 |
|
|
言語 |
jpn |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者 |
高市, 晃佑
片上, 敬雄
黒澤, 義明
目良, 和也
竹澤, 寿幸
TAKAICHI, Kosuke
KATAGAMI, Yoshio
KUROSAWA, Yoshiaki
MERA, Kazuya
TAKEZAWA, Toshiyuki
|
抄録 |
|
|
内容記述タイプ |
Abstract |
|
内容記述 |
We aim to separate sound sources by deep neural networks which has been active in recent years. We attempt to extract a certain human voice from usual conversation using the networks. We focus on image-to-image translation: pix2pix. The algorithm of pix2pix bases on purely procedure of the image processing. Therefore, we need an additional procedure, that is, we convert voice to spectrogram once. After that we perform to learn the networks to separate human voice, we especially pay attention to segmentation between the same sex and opposite sex. Form this point of view, we conducted two experiments using the sounds overlapped both sexes in this paper. Structure-Similarity (SSIM) index and color map representation were used as evaluation criteria. As a result, we confirmed the good extraction of the female voice from the one synthesized both sexes. However, we did not extract the female voice from same sex. Although we reached the conclusion that the separation did not work well, the generated voice seemed to be played naturally. This is not objective judgment. For this reason, it is our future work. |
内容記述 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
2019年度(第33回):2019年6月4日-6月7日:新潟県新潟市(朱鷺メッセ新潟コンベンションセンター) 3Rin2-31 この研究は, 国立研究開発法人科学技術振興機構(JST)の研究成果展開事業「センター・オブ・イノベーション(COI)プログラム」の補助を得ている |
書誌情報 |
人工知能学会全国大会論文集
巻 33,
p. 1-3,
発行日 2019
|
出版者 |
|
|
出版者 |
人工知能学会 |
DOI |
|
|
関連タイプ |
isIdenticalTo |
|
|
識別子タイプ |
DOI |
|
|
関連識別子 |
info:doi/https://doi.org/10.11517/pjsai.JSAI2019.0_3Rin231 |
権利 |
|
|
権利情報 |
本著作物の著作権は人工知能学会に帰属します。本著作物は著作権者である人工知能学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」に従うことをお願いいたします。 |
関連サイト |
|
|
|
識別子タイプ |
URI |
|
|
関連識別子 |
https://www.ai-gakkai.or.jp/ |
|
|
関連名称 |
https://www.ai-gakkai.or.jp/ |
フォーマット |
|
|
内容記述タイプ |
Other |
|
内容記述 |
application/pdf |
著者版フラグ |
|
|
出版タイプ |
VoR |
|
出版タイプResource |
http://purl.org/coar/version/c_970fb48d4fbd8a85 |