ログイン
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 会議発表論文
  2. 人工知能学会全国大会論文集
  3. 37

GANを用いた声質変換における周波数帯域ごとの分析

https://hiroshima-cu.repo.nii.ac.jp/records/1969
https://hiroshima-cu.repo.nii.ac.jp/records/1969
3c47f2ef-9341-4982-acf2-9e99839ddff5
名前 / ファイル ライセンス アクション
4Xin1-26 4Xin1-26 .pdf (1.1 MB)
Item type 会議発表論文 / Conference Paper(1)
公開日 2023-07-04
タイトル
タイトル GANを用いた声質変換における周波数帯域ごとの分析
タイトル
タイトル Frequency Analysis in Voice Conversion Using Generative Adversarial Networks
言語 en
その他(別言語等)のタイトル
その他のタイトル GAN オ モチイタ セイシツ ヘンカン ニオケル シュウハスウ タイイキ ゴト ノ ブンセキ
言語
言語 jpn
キーワード
主題Scheme Other
主題 声質変換
キーワード
主題Scheme Other
主題 GAN
キーワード
主題Scheme Other
主題 Generative Adversarial Networks
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_5794
資源タイプ conference paper
著者 和田, 楓也

× 和田, 楓也

和田, 楓也

ja-Kana ワダ, フウヤ

Search repository
黒澤, 義明

× 黒澤, 義明

黒澤, 義明

ja-Kana クロサワ, ヨシアキ

Search repository
目良, 和也

× 目良, 和也

目良, 和也

ja-Kana メラ, カズヤ

Search repository
竹澤, 寿幸

× 竹澤, 寿幸

竹澤, 寿幸

ja-Kana タケザワ, トシユキ

Search repository
WADA, Fuya

× WADA, Fuya

en WADA, Fuya

Search repository
KUROSAWA, Yoshiaki

× KUROSAWA, Yoshiaki

en KUROSAWA, Yoshiaki

Search repository
MERA, Kazuya

× MERA, Kazuya

en MERA, Kazuya

Search repository
TAKEZAWA, Toshiyuki

× TAKEZAWA, Toshiyuki

en TAKEZAWA, Toshiyuki

Search repository
抄録
内容記述タイプ Abstract
内容記述 In recent years, deep learning has enabled high-quality speech synthesis and voice quality conversion. Traditional methods use a GAN (Generative Adversarial Network) to perform voice conversion. However, the generated speech sounds a little muffled compared to actual speech. There are also some shortcomings regarding the generated 2D features. Therefore, in this
study, the generated spectrogram is divided into several frequency bands, and the Mel-Cepstrum Distortion (MCD) of each frequency band to investigate and analyze which frequency bands are well generated. Analysis showed that the low frequency of the generated Spectrograms were well generated, but the mid/high frequency were not well generated. In addition, we
found that although the linguistic information was reproduced, the reproduction of speaker characteristics was insufficient.
抄録
内容記述タイプ Abstract
内容記述 近年,深層学習により高品質な音声合成・声質変換が行えるようになっている.従来の手法では,GAN(Generative Adversarial Network)を用い,声質変換を行っている.しかし,生成された音声は本物の音声と比べ,ややこもったような音声となっており,生成された2次元特徴量に関しても不十分な箇所はある.そこで本研究では,生成されるSpectrogramを数個の周波数帯域ごとに分割し,それぞれの周波数帯域ごとのMCD(Mel-Cepstrum Distortion)を計算し,どの周波数帯域がうまく生成されている調査・分析を行う.分析の結果、生成されたSpectrogramの低周波帯域はうまく生成できていたが,中・高周波帯域は生成が不十分であることが分かった.また,言語情報の再現はできているが,話者性の再現は不十分であることも分かった.
内容記述
内容記述タイプ Other
内容記述 2023年度(第37回):2023年6月6日-6月9日:熊本県熊本市(熊本城ホール)+オンライン 4Xin1-26
書誌情報 人工知能学会全国大会論文集

巻 37, p. 1-4, 発行日 2023-06
出版者
出版者 人工知能学会
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AA11578981
権利
権利情報 本著作物の著作権は人工知能学会に帰属します。本著作物は著作権者である人工知能学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」に従うことをお願いいたします。
関連サイト
識別子タイプ URI
関連識別子 https://www.ai-gakkai.or.jp/
関連名称 人工知能学会
フォーマット
内容記述タイプ Other
内容記述 application/pdf
著者版フラグ
出版タイプ VoR
出版タイプResource http://purl.org/coar/version/c_970fb48d4fbd8a85
戻る
0
views
See details
Views

Versions

Ver.1 2023-07-25 10:29:41.914895
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR 2.0
  • OAI-PMH JPCOAR 1.0
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3