WEKO3
アイテム
言語モデルによる知識情報の関連付けについての文書検索タスクの分析
https://doi.org/10.14988/0002001368
https://doi.org/10.14988/00020013683a90b578-4270-4d41-af4b-ee66d9f514e2
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
|
| Item type | 紀要論文 / Departmental Bulletin Paper(1) | |||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2025-10-20 | |||||||||||||||||||||
| タイトル | ||||||||||||||||||||||
| タイトル | 言語モデルによる知識情報の関連付けについての文書検索タスクの分析 | |||||||||||||||||||||
| 言語 | ja | |||||||||||||||||||||
| タイトル | ||||||||||||||||||||||
| タイトル | ゲンゴ モデル ニヨル チシキ ジョウホウ ノ カンレンズケ ニツイテノ ブンショ ケンサク タスク ノ ブンセキ | |||||||||||||||||||||
| 言語 | ja-Kana | |||||||||||||||||||||
| タイトル | ||||||||||||||||||||||
| タイトル | Analysis on Japanese retrieval tasks regarding knowledge association by language models | |||||||||||||||||||||
| 言語 | en | |||||||||||||||||||||
| 言語 | ||||||||||||||||||||||
| 言語 | jpn | |||||||||||||||||||||
| キーワード | ||||||||||||||||||||||
| 主題 | 自然言語処理, 密ベクトル表現, 言語モデル, 日本語テキスト埋め込み, 文書検索 NLP, dense retrieval|, language models, Japanese text embedding, information retrieval |
|||||||||||||||||||||
| 資源タイプ | ||||||||||||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||||||||||||||||
| 資源タイプ | departmental bulletin paper | |||||||||||||||||||||
| ID登録 | ||||||||||||||||||||||
| ID登録 | 10.14988/0002001368 | |||||||||||||||||||||
| ID登録タイプ | JaLC | |||||||||||||||||||||
| アクセス権 | ||||||||||||||||||||||
| アクセス権 | open access | |||||||||||||||||||||
| アクセス権URI | http://purl.org/coar/access_right/c_abf2 | |||||||||||||||||||||
| 著者 |
西浦, 良太
× 西浦, 良太× 土屋, 誠司
CiNii ID
1000070452654
× 渡部, 広一
CiNii ID
1000090201251
|
|||||||||||||||||||||
| 抄録 | ||||||||||||||||||||||
| 内容記述タイプ | Abstract | |||||||||||||||||||||
| 内容記述 | 近年,文書検索は言語モデルが外部情報を参照するための手段として更に注目されている.本研究では,日本語テキスト埋め込み手法を用いた検索アプローチの有効性を分析した.既存ベンチマークに含まれる検索クエリと文書をモデル知識の有無で分類した.その結果,知識を持たない場合に取得精度が低下した.この分析に基づき,既存手法による文書検索の利点と課題を検討し,実世界の問題との乖離を踏まえた今後の方向性を示す. | |||||||||||||||||||||
| 言語 | ja | |||||||||||||||||||||
| 抄録 | ||||||||||||||||||||||
| 内容記述タイプ | Abstract | |||||||||||||||||||||
| 内容記述 | Retrieval tasks are increasingly recognized as an effective means for language models to reference external information. In this study, we analyze and discuss the effectiveness of a retrieval approach using text embedding methods in a Japanese-language context. We classify the process of embedding queries using sentence embedding generation models into two patterns: one where the generation model possesses knowledge about the query, and one where it does not. Benchmark results obtained for each pattern revealed that retrieval accuracy declines when embedding models lack knowledge about the query. Based on this analysis, we discuss the advantages and disadvantages of existing retrieval approaches, focusing on the qualitative gap between benchmark tasks and real-world problems, and explore potential directions for future development of information retrieval. | |||||||||||||||||||||
| 言語 | en | |||||||||||||||||||||
| 内容記述 | ||||||||||||||||||||||
| 内容記述 | 原著論文 | |||||||||||||||||||||
| 書誌情報 |
ja : 同志社大学ハリス理化学研究報告 en : The Harris science review of Doshisha University 巻 66, 号 3, p. 175-182, 発行日 2025-10 |
|||||||||||||||||||||
| 出版者 | ||||||||||||||||||||||
| 出版者 | 同志社大学ハリス理化学研究所 | |||||||||||||||||||||
| 言語 | ja | |||||||||||||||||||||
| 出版者(英) | ||||||||||||||||||||||
| 出版者 | Harris Science Research Institute of Doshisha University | |||||||||||||||||||||
| 言語 | en | |||||||||||||||||||||
| ISSN | ||||||||||||||||||||||
| 収録物識別子タイプ | PISSN | |||||||||||||||||||||
| 収録物識別子 | 21895937 | |||||||||||||||||||||
| 書誌レコードID | ||||||||||||||||||||||
| 収録物識別子タイプ | NCID | |||||||||||||||||||||
| 収録物識別子 | AA12716107 | |||||||||||||||||||||
| 権利者情報 | ||||||||||||||||||||||
| 権利者識別子Scheme | AID | |||||||||||||||||||||
| 権利者識別子URI | https://ci.nii.ac.jp/author/DA18202107 | |||||||||||||||||||||
| 権利者識別子 | DA18202107 | |||||||||||||||||||||
| 権利者名 | 同志社大学ハリス理化学研究所 | |||||||||||||||||||||
| 言語 | ja | |||||||||||||||||||||
| 権利者名 | Harris Science Research Institute of Doshisha University | |||||||||||||||||||||
| 言語 | en | |||||||||||||||||||||
| 出版タイプ | ||||||||||||||||||||||
| 出版タイプ | VoR | |||||||||||||||||||||
| 出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |||||||||||||||||||||
| 助成情報 | ||||||||||||||||||||||
| 識別子タイプ | Crossref Funder | |||||||||||||||||||||
| 助成機関識別子 | https://doi.org/10.13039/501100002241 | |||||||||||||||||||||
| 助成機関名 | 科学技術振興機構 | |||||||||||||||||||||
| 言語 | ja | |||||||||||||||||||||
| 助成機関名 | Japan Science and Technology Agency | |||||||||||||||||||||
| 言語 | en | |||||||||||||||||||||
| プログラム情報識別子タイプ | Crossref Funder | |||||||||||||||||||||
| プログラム情報識別子タイプURI | https://doi.org/10.13039/501100025019 | |||||||||||||||||||||
| 言語 | ja | |||||||||||||||||||||
| プログラム情報 | 次世代研究者挑戦的研究プログラム | |||||||||||||||||||||
| 言語 | en | |||||||||||||||||||||
| プログラム情報 | Support for Pioneering Research Initiated by the Next Generation (SPRING) | |||||||||||||||||||||
| 研究課題番号URI | https://rd.doshisha.ac.jp/rd/inside/wakate/sprig/spring.html | |||||||||||||||||||||
| 研究課題番号 | JPMJSP2129 | |||||||||||||||||||||
| 研究課題番号タイプ | JGN | |||||||||||||||||||||
| 研究課題名 | 言語モデルにおける情報検索手法の知識変容に対する頑健性の評価指標の構築 | |||||||||||||||||||||
| 言語 | ja | |||||||||||||||||||||