index:source
差分
この文書の現在のバージョンと選択したバージョンの差分を表示します。
両方とも前のリビジョン 前のリビジョン 次のリビジョン | 前のリビジョン | ||
index:source [2024/01/26 10:28] tk [意味の分類体系] |
index:source [2024/01/26 15:53] (現在) tk [起点領域の意味クラス] |
||
---|---|---|---|
ライン 1: | ライン 1: | ||
====== 起点領域の意味クラス ====== | ====== 起点領域の意味クラス ====== | ||
- | ===== 意味の分類体系 ===== | + | 以下は、起点領域として用いられるDomainごとのGroupのリストです。目標領域については[[index:target]]を参照してください。詳しくは[[index:mapping]]を参照してください。 |
- | + | ||
- | ==== 意味分類の方針 ==== | + | |
- | + | ||
- | 意味クラスの分類は『[[https://clrd.ninjal.ac.jp/goihyo.html|分類語彙表-増補改訂版データベース]]』(以下『分類語彙表』)を用いています。 | + | |
- | + | ||
- | * 『分類語彙表』の意味的な階層分類は、より上位のものから、類/部門/中項目/分類番号/段落番号/小段落番号からなります。このコーパスでは便宜的に、『分類語彙表』の「類」をDomain、「中項目」をGroup、「分類番号」をSection、「段落番号」をClassとよんでいます。 | + | |
- | * 本コーパスでは「段落番号」を意味クラスの最小単位 (Class) として、意味のアノテーションを行っています。コーパス内には10902個のClassページがあり、それぞれが上位のSection、Group、Domainに分類されています。 | + | |
- | * Class1つには、平均して10語程度が含まれます。同じClassの語は似た意味を持っているため、具体性の高い意味分類のカテゴリーと考えることができます。 | + | |
- | + | ||
- | 以下のような方針で、具体的な用例の意味論的アノテーションを行っています。(参考: | + | |
- | [[info:faq|意味分類の問題点は?]]) | + | |
- | + | ||
- | * 起点領域の意味とは、テキスト本文に生起しているFocusの表現に近い語が含まれるClassであると考えます。 | + | |
- | * 目標領域の表現はコンテクストから推論できるStandardの表現に近い語が含まれるClassであると考えます。 | + | |
- | * [[index:mapping]]は、起点領域のClassと目標領域のClassの対応関係であると考えます。 | + | |
- | + | ||
- | ==== 意味分類の例 ==== | + | |
- | + | ||
- | * Domainの例:[[source:1]] | + | |
- | * Groupの例:[[source:1.54]] | + | |
- | * Sectionの例:[[source:1.5410]] | + | |
- | * Classの例:[[source:1.5410-15]] | + | |
- | + | ||
- | 最上位の分類であるDomainは4個で、「体」は主に名詞、「用」は主に動詞、「相」は主に形容詞、「その他」はその他の語彙からなる語が分類されています。 | + | |
- | + | ||
- | 以下は、起点領域として用いられるDomainごとのGroupのリストです。目標領域については[[index:target]]を参照してください。 | + | |
===== 「体」 ===== | ===== 「体」 ===== |
最終更新: 2024/01/26 10:28