Item type |
会議発表論文 / Conference Paper(1) |
公開日 |
2023-03-07 |
タイトル |
|
|
タイトル |
大規模対話音声コーパス作成を目的とする振幅情報と位相情報に着目した複数話者と単数話者の区間分類 |
タイトル |
|
|
タイトル |
Section Classification of Multiple Speakers and Single Speaker Focusing on Amplitude Information and Phase Information for Creating Large-Scale Dialogue Speech Corpus |
|
言語 |
en |
その他(別言語等)のタイトル |
|
|
その他のタイトル |
ダイキボ タイワ オンセイ コーパス サクセイ オ モクテキ トスル シンプク ジョウホウ ト イソウ ジョウホウ ニ チャクモク シタ フクスウ ワシャ ト タンスウ ワシャ ノ クカン ブンルイ |
言語 |
|
|
言語 |
jpn |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者 |
羽原, 俊輔
黒澤, 義明
目良, 和也
竹澤, 寿幸
HABARA, Shunsuke
KUROSAWA, Yoshiaki
MERA, Kazuya
TAKEZAWA, Toshiyuki
|
抄録 |
|
|
内容記述タイプ |
Abstract |
|
内容記述 |
Currently, the necessity of a large-scale speech corpus is increasing, due to development of the end-to-end synthetic speech system. In order to creating a speech corpus from conversational speech, the speech is cut out for each speaker and annotationis performed. Since this task is very burdensome, this study is a basic study of speech corpus creation support. In this study, we propose multiple speakers and a single speaker section classification from dialogue speech as support for speech corpus creation. In particular, we compared section classifications based on phase as well as amplitude as speech features. In addition, the difference between CNN and RNN classification results was discussed. As a result, multi-speaker and single-speaker can be classified by using speech phase information. In addition, we found that the classification accuracy was improved by using CNN. |
内容記述 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
2020年度(第34回) : 2020年6月9日-6月12日 : オンライン 4Rin1-62 本研究の一部は国立研究開発法人科学技術振興機構(JST)の研究成果展開事業「センター・オブ・イノベーション(COI)プログラム」グラント番号JPMJCE1311の支援によって行われている。 |
書誌情報 |
人工知能学会全国大会論文集
巻 34,
p. 1-4,
発行日 2020
|
出版者 |
|
|
出版者 |
人工知能学会 |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA11578981 |
DOI |
|
|
関連タイプ |
isIdenticalTo |
|
|
識別子タイプ |
DOI |
|
|
関連識別子 |
info:doi/https://doi.org/10.11517/pjsai.JSAI2020.0_4Rin162 |
権利 |
|
|
権利情報 |
本著作物の著作権は人工知能学会に帰属します。本著作物は著作権者である人工知能学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」に従うことをお願いいたします。 |
関連サイト |
|
|
|
識別子タイプ |
URI |
|
|
関連識別子 |
https://www.ai-gakkai.or.jp/ |
|
|
関連名称 |
https://www.ai-gakkai.or.jp/ |
フォーマット |
|
|
内容記述タイプ |
Other |
|
内容記述 |
application/pdf |
著者版フラグ |
|
|
出版タイプ |
VoR |
|
出版タイプResource |
http://purl.org/coar/version/c_970fb48d4fbd8a85 |