
ChatGPTをはじめとする大規模言語モデル(LLM)は、メタデータ作成、意味情報の補完、作品解説文の生成など、デジタル・ヒューマニティーズ(DH)分野においても広く活用されている。一方で、AIが生成した記述の品質を評価するとともに、人手で整備されたメタデータが生成結果にどのような影響を与えるのかを検証することが重要である。
本研究では、陶磁器作品を対象とした自動説明文生成について検討する。陶磁器は絵画のような平面的な作品と比較して形状や構造が複雑であり、記述生成が難しい。また、歴史的に広く制作・利用されてきた一方で、記録が不完全な場合も多く、DH研究において重要な対象である。
実験では、11,566件のオープンアクセス収蔵品データからなるRijksmuseumデータセットを用い、LLM(ChatGPT)と、類似作品を検索してそのメタデータを活用する検索拡張生成(RAG)型LLMであるTerraLexを比較した。その結果、RAGを用いた手法(TerraLex)は、事実誤認が少なく、より正確で文脈情報を豊富に含む記述を生成した。また、人間による評価においても一貫して高い評価を得た。これらの結果から、陶磁器作品の記述生成におけるRAGの有効性と、人手で作成された高品質なメタデータの重要性が明らかとなった。
参考文献
Kaoru Shimabayashi and Kumiko Tanaka-Ishii. Retrieval-Augmented Description Generation for Ceramic Artworks — Effectiveness of Knowledge-Enhancement by the Museum Metadata. Accepted to Digital Humanities 2026 (DH2026), the annual international conference of the Association of Digital Humanities Organizations (ADHO), to appear in 2026. [link]