WEKO3
アイテム
特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して
https://hiroshima-cu.repo.nii.ac.jp/records/1788
https://hiroshima-cu.repo.nii.ac.jp/records/1788628684c8-0932-4b6a-8875-27fde85f095a
名前 / ファイル | ライセンス | アクション |
---|---|---|
IPSJ-FI08089005.pdf (634.9 kB)
|
|
Item type | テクニカルレポート / Technical Report_02(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2023-05-26 | |||||
タイトル | ||||||
タイトル | 特許情報処理を指向したテストコレクションの構築 : 情報検索と自然言語処理の融合を目指して | |||||
タイトル | ||||||
タイトル | Producing Test Collections for Patent Information Processing : Toward the Fusion of Information Retrieval and Natural Language Processing | |||||
言語 | en | |||||
言語 | ||||||
言語 | jpn | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||
資源タイプ | technical report | |||||
著者 |
藤井, 敦
× 藤井, 敦× 難波, 英嗣× 岩山, 真× 神門, 典子× 内山, 将夫× 山本, 幹雄× 宇津呂, 武仁× 橋本, 泰一× FUJII, Atsushi× NANBA, Hidetsugu× IWAYAMA, Makoto× KANDO, Noriko× UCHIYAMA, Masao× YAMAMOTO, Mikio× UTSURO, Takehito× HASHIMOTO, Taiichi |
|||||
抄録 | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | 情報検索や自然言語処理に関する技術を体系的に評価するためには,ベンチマークとして研究者が共有できる大規模なテストコレクションが必要である.本稿は,NTCIRワークショップにおいて構築している特許情報処理テストコレクションについて,検索,分類,機械翻訳,マイニングの観点から解説する.検索では技術動向調査,無効資料調査,パッセージ検索を目的とし,分類ではFタームに基づくカテゴリ分類を目的としたテストコレクションを構築した.現在進行中のワークショップでは,検索や分類で用いた日英特許情報を応用して,翻訳とマイニングに関するテストコレクションを構築している.翻訳では,対応特許(パテントファミリー)から抽出した文対応データをシステムの訓練や評価に用いる.マイニングでは,特許と技術論文を横断した技術動向分析を想定して,論文抄録に特許分類のカテゴリを付与することを目的とする. | |||||
抄録 | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | To evaluate technologies for information retrieval and natural language processing systematically, sharable large test collections as benchmark data are needed. This paper describes the test collections for patent information processing at the NTCIR workshop from retrieval, classification, machine translation, and mining perspectives. For the retrieval task, test collections for technology survey, invalidity search, and passage retrieval were produced. For the classification task, test collections for the F-term patent classification system were produced. In the current workshop, applying the patent documents in Japanese and English that were used for the retrieval and classification tasks, test collections for machine translation and mining are being produced. For the translation task, sentence-aligned data extracted from patent families are used for training and evaluation purposes. For the mining task, aimed at the analysis of technology trends across patents and technical papers, the purpose is to categorize technical abstracts based on a patent classification system. | |||||
書誌情報 |
情報処理学会研究報告. 自然言語処理研究会報告 巻 2008, 号 4, p. 31-36, 発行日 2008-01-21 |
|||||
出版者 | ||||||
出版者 | 情報処理学会 | |||||
書誌レコードID | ||||||
収録物識別子タイプ | NCID | |||||
収録物識別子 | AN10115061 | |||||
論文ID(NAID) | ||||||
関連タイプ | isIdenticalTo | |||||
識別子タイプ | NAID | |||||
関連識別子 | 110006623471 | |||||
権利 | ||||||
権利情報 | 本著作物の著作権は(社)情報処理学会に帰属します。本著作物は著作権者である情報処理学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」ならびに「情報処理学会倫理綱領」に従うことをお願いいたします。 | |||||
権利 | ||||||
権利情報 | The copyright of this material is retained by the Information Processing Society of Japan (IPSJ). This material is published on this web site with the agreement of the author (s) and the IPSJ. Please be complied with Copyright Law of Japan and the Code of Ethics of the IPSJ if any users wish to reproduce, make derivative work, distribute or make available to the public any part or whole thereof. All Rights Reserved, Copyright (C) Information Processing Society of Japan. | |||||
関連サイト | ||||||
識別子タイプ | URI | |||||
関連識別子 | http://www.ipsj.or.jp/ | |||||
関連名称 | http://www.ipsj.or.jp/ | |||||
フォーマット | ||||||
内容記述タイプ | Other | |||||
内容記述 | application/pdf | |||||
著者版フラグ | ||||||
出版タイプ | VoR | |||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 |