
ChatGPT などの大規模言語モデル(LLM)は、メタデータ作成、意味的情報の拡充、作品キャプション生成といった文化遺産分野のタスクにおいて、ますます広く利用されている。これらのタスクは、整理・管理されたメタデータに大きく依存するため、AI が生成した記述を評価するとともに、人手で整備されたメタデータが生成記述の質をどのように高めるのかを理解することが重要である。
本研究では、デジタル・ヒューマニティーズ(DH)の文脈において、陶磁器作品の記述を自動生成する手法を提案する。陶磁器は、絵画のような平面的な作品に比べて三次元的で記述が難しい一方、形状が比較的単純であるため生成品質の基本的な評価に適している。また、歴史的に広く用いられてきた資料でありながら、記録が不完全な場合も多いことから、記述生成の対象として重要である。
本研究では、11,566 件からなるオープンアクセスの Rijksmuseum データセットを用い、LLM(ChatGPT)と、類似作品を検索してそのメタデータを利用する RAG 強化型 LLM である TerraLex を比較する。実験の結果、RAG を用いた手法は、誤りが少なく、より正確で文脈情報を豊富に含む記述を生成し、人間の評価者からも一貫して高く評価された。これらの結果は、記述生成における RAG の有効性と、完全で高品質な人手によるメタデータの重要性を示している。TerraLex は、目録作成、様式比較、解釈に用いられる作品記述の完全性と明瞭性を高めることで、人文学研究を支援する。また、陶磁器資料に関する分かりやすい説明を提供することで、教育や一般向けの理解促進にも貢献する。本研究の新規性は、主として提案するワークフローと、メタデータ生成において実証されたその効果にある。
参考文献
Kaoru Shimabayashi and Kumiko Tanaka-Ishii. Retrieval-Augmented Description Generation for Ceramic Artworks — Effectiveness of Knowledge-Enhancement by the Museum Metadata. Accepted to Digital Humanities 2026 (DH2026), the annual international conference of the Association of Digital Humanities Organizations (ADHO), to appear in 2026. [link]