平江方言非遗数据库 Metadata 规范

Pingjiang Dialect Intangible Heritage Metadata Schema / Version 2.0

0. 项目定位

本规范用于整理平江方言相关非物质文化遗产资料,包括影戏、灯戏、夜歌、唱经、三花白、吟诵、快板、歌谣、童谣、方言对话、古书诵读,以及手抄本、科仪本、戏本等文献资料。

核心原则:多模态 + 多语言层 + AI-ready

1. 数据库结构

Pingjiang-ICH-Corpus/
├── metadata/
├── audio/
├── video/
├── eaf/
├── subtitle/
├── transcription/
├── translation/
├── documents/
├── images/
├── speaker/
└── README/

2. Genre 类型规范

genre中文English日本語
shadow_puppetry影戏Shadow Puppetry影絵芝居
lantern_opera灯戏Lantern Opera灯戯
night_song夜歌Night Song夜歌
ritual_chant唱经Ritual Chant唱経
sanhuabai三花白Sanhuabai三花白
recitation吟诵Recitation吟誦
kuaiban快板Kuaiban快板
folk_song歌谣Folk Song歌謡
nursery_rhyme童谣Nursery Rhyme童謡
conversation方言对话Conversation方言会話
classical_text_reading古书诵读Classical Text Reading古書吟誦
daoist_ritual道教仪式Daoist Ritual道教儀礼
buddhist_ritual佛教仪式Buddhist Ritual仏教儀礼
funeral_ritual丧礼Funeral Ritual葬礼儀礼
wangmu_ritual王母教仪式Wangmu Ritual王母教儀礼

3. 文件命名规范

PG_[GenreCode]_[Number]_[Title]

例:PG_TY_001_banzhy

Code类型
TY童谣
PY影戏
DX灯戏
CJ唱经
FH方言会话
DJ道教
SL丧礼

4. Metadata 核心字段

Field中文English日本語
identifier唯一IDUnique Identifier識別ID
title标题Titleタイトル
genre类型Genreジャンル
language语言Language言語
dialect方言Dialect方言
recording_place采录地点Recording Place収録地点
recording_date采录日期Recording Date収録日
collector采录者Collector採録者
speaker说话人Speaker話者
duration时长Duration長さ
annotation_status标注状态Annotation Status注釈状態

5. Language Layer 语言层

language_layer内容
colloquial_dialect方言口语
literary_speech文言对白
sung_lyrics唱词
ritual_language仪式语言
scripture_language经文语言
recited_text吟诵文本

6. AI-ready 字段

Field说明
ai_ready是否AI可利用
asr_usable是否适合语音识别
speaker_overlap是否多人重叠
rhythm_pattern是否有节奏
rhyme_pattern是否押韵
time_aligned是否有时间对齐

7. ELAN Tier 推荐结构

Tier内容
TX汉字
PGPY平江拼音
PGMPIPA
GE_translation英语翻译
translation_ja日语翻译
rhyme押韵
note注释

8. 返回

返回首页 / Back to home