DH 2026. 陶磁器作品のための検索拡張型説明文生成：博物館収蔵品データによる知識強化

ChatGPTをはじめとする大規模言語モデル（LLM）は、メタデータ作成、意味情報の補完、作品解説文の生成など、デジタル・ヒューマニティーズ（DH）分野においても広く活用されている。一方で、AIが生成した記述の品質を評価するとともに、人手で整備されたメタデータが生成結果にどのような影響を与えるのかを検証することが重要である。

本研究では、陶磁器作品を対象とした自動説明文生成について検討する。陶磁器は絵画のような平面的な作品と比較して形状や構造が複雑であり、記述生成が難しい。また、歴史的に広く制作・利用されてきた一方で、記録が不完全な場合も多く、DH研究において重要な対象である。

実験では、11,566件のオープンアクセス収蔵品データからなるRijksmuseumデータセットを用い、LLM（ChatGPT）と、類似作品を検索してそのメタデータを活用する検索拡張生成（RAG）型LLMであるTerraLexを比較した。その結果、RAGを用いた手法（TerraLex）は、事実誤認が少なく、より正確で文脈情報を豊富に含む記述を生成した。また、人間による評価においても一貫して高い評価を得た。これらの結果から、陶磁器作品の記述生成におけるRAGの有効性と、人手で作成された高品質なメタデータの重要性が明らかとなった。

参考文献

Kaoru Shimabayashi and Kumiko Tanaka-Ishii. Retrieval-Augmented Description Generation for Ceramic Artworks — Effectiveness of Knowledge-Enhancement by the Museum Metadata. Accepted to Digital Humanities 2026 (DH2026), the annual international conference of the Association of Digital Humanities Organizations (ADHO), to appear in 2026. [link]

Categorized in:

機械学習言語

DH 2026. 陶磁器作品のための検索拡張型説明文生成：博物館収蔵品データによる知識強化

参考文献

Leave a Reply Cancel reply

Other Stories

ACL 2026　重複列が明らかにする大規模言語モデルと自然言語の差

ICML 2026. 幾何学的制御による LLM 生成におけるモード崩壊からの脱却

TACL. 形式意味論的保証を緩和した条件下でのベンチマーク言語理解

ACL 2026　重複列が明らかにする大規模言語モデルと自然言語の差

ICML 2026. 幾何学的制御による LLM 生成におけるモード崩壊からの脱却

ICML 2024 Oral. 情報ボトルネック最小な文書索引

Physical Review Research 2024. 自然言語の相関次元を測る

Knowledge-Based Systems 2022. 極端リスクによる金融市場のモデル化

ACL 2018. 言語の構造的複雑さの計量

NeurIPS 2022. 非線形な単語埋め込み表現

TACL. 形式意味論的保証を緩和した条件下でのベンチマーク言語理解

ACL 2026　重複列が明らかにする大規模言語モデルと自然言語の差

ICML 2026. 幾何学的制御による LLM 生成におけるモード崩壊からの脱却

NeurIPS 2025. 自回帰型大規模言語モデルにおける相関次元

🏆ACL 2025 Outstanding Paper Award. Zipfの意味ー頻度則の新しい定式化

ACL 2020. 株の埋め込み表現

ACM ICAIF 2023. ニューラル分布変換でRealized Volatilityを予測

ACL 2020. テキストの価格に対する影響

Knowledge-Based Systems 2022. 極端リスクによる金融市場のモデル化

Press ESC to close

Or check our Popular Categories...

参考文献

Leave a Reply Cancel reply

Related Articles

Other Stories

ACL 2026 重複列が明らかにする大規模言語モデルと自然言語の差

ICML 2026. 幾何学的制御による LLM 生成におけるモード崩壊からの脱却

ACL 2026　重複列が明らかにする大規模言語モデルと自然言語の差