このサイトについて
OdGenji: 源氏物語の香りデータベース
本データベースは、源氏物語に登場する香りの表現を収集・整理したデータベースです。
プロジェクト概要
本データベースは国文学研究資料館共同研究プロジェクト「国書データベースとそのテキストデータを活用した教材作成と LOD の構築 -学校での授業実践と国際連携を通して-」(研究代表者:大井将生、研究期間:2025-2026 年度、共同研究番号:K454082526)の成果の一部です。
収録データについて
本データベースには、源氏物語全 54 巻から抽出された140 件の香り描写を収録しています。
使用テキスト:
- 校異源氏物語の TEI-XML 形式テキストを使用
データ抽出方法:
- TEI-XML 形式の源氏物語テキストから、AI(Google Gemini 2.5 Pro)を用いて自動抽出
- 嗅覚的な香りの描写のみを厳密に抽出(視覚的な「にほひ」などは除外)
- 原文、現代語訳、英訳に加え、香りの性質、場所、知覚者、状況などのメタデータを付与
詳しくは香り情報の抽出方法をご覧ください。
主な機能
- 香り検索: 源氏物語に登場する香りの表現を様々な条件で検索できます
- 詳細情報: 各香りの表現について、原文・現代語訳・英訳などを確認できます
- ファセット検索: 巻数、香りの言葉、性質、場所、知覚者、時間などの条件で絞り込めます
技術ドキュメント
本データベースの構築に使用した技術資料を公開しています:
- 香り情報の抽出方法 - XML テキストから香り情報を抽出する方法
- 香り画像の生成方法 - DALL-E 3 による画像生成の方法
- データ構造 - CIDOC-CRM と OdEuropa オントロジーに基づく RDF/XML データ構造
オープンデータ
すべてのデータはセマンティック Web 標準に準拠した RDF/XML 形式で公開しています:
- 統合 RDF データをダウンロード (33 巻、140 件の香り描写、989KB)
関連リンク
お問い合わせ
本データベースに関するご質問・ご意見は、研究代表者までお問い合わせください。