index:source

差分

この文書の現在のバージョンと選択したバージョンの差分を表示します。

この比較画面にリンクする

両方とも前のリビジョン 前のリビジョン
次のリビジョン
前のリビジョン
index:source [2024/01/26 10:28]
tk [意味の分類体系]
index:source [2024/01/26 15:53] (現在)
tk [起点領域の意味クラス]
ライン 1: ライン 1:
 ====== 起点領域の意味クラス ====== ====== 起点領域の意味クラス ======
  
-===== 意味の分類体系 ===== +以下は、起点領域として用いられるDomainごとのGroupのリストです。目標領域については[[index:​target]]を参照してください。詳しくは[[index:​mapping]]を参照してください。
- +
-==== 意味分類の方針 ==== +
- +
-意味クラスの分類は『[[https://​clrd.ninjal.ac.jp/​goihyo.html|分類語彙表-増補改訂版データベース]]』(以下『分類語彙表』)を用いています。 +
- +
-  * 『分類語彙表』の意味的な階層分類は、より上位のものから、類/部門/中項目/分類番号/段落番号/小段落番号からなります。このコーパスでは便宜的に、『分類語彙表』の「類」をDomain、「中項目」をGroup、「分類番号」をSection、「段落番号」をClassとよんでいます。 +
-  * 本コーパスでは「段落番号」を意味クラスの最小単位 (Class) として、意味のアノテーションを行っています。コーパス内には10902個のClassページがあり、それぞれが上位のSection、Group、Domainに分類されています。 +
-  * Class1つには、平均して10語程度が含まれます。同じClassの語は似た意味を持っているため、具体性の高い意味分類のカテゴリーと考えることができます。 +
- +
-以下のような方針で、具体的な用例の意味論的アノテーションを行っています。(参考: +
-[[info:​faq|意味分類の問題点は?]]) +
- +
-  * 起点領域の意味とは、テキスト本文に生起しているFocusの表現に近い語が含まれるClassであると考えます。 +
-  * 目標領域の表現はコンテクストから推論できるStandardの表現に近い語が含まれるClassであると考えます。 +
-  * [[index:​mapping]]は、起点領域のClassと目標領域のClassの対応関係であると考えます。 +
- +
-==== 意味分類の例 ==== +
- +
-  * Domainの例:[[source:​1]] +
-  * Groupの例:[[source:​1.54]] +
-  * Sectionの例:[[source:​1.5410]] +
-  * Classの例:[[source:​1.5410-15]] +
- +
-最上位の分類であるDomainは4個で、「体」は主に名詞、「用」は主に動詞、「相」は主に形容詞、「その他」はその他の語彙からなる語が分類されています。 +
- +
-以下は、起点領域として用いられるDomainごとのGroupのリストです。目標領域については[[index:​target]]を参照してください。+
  
 ===== 「体」 ===== ===== 「体」 =====
最終更新: 2024/01/26 10:28