index:source

差分

この文書の現在のバージョンと選択したバージョンの差分を表示します。

この比較画面にリンクする

両方とも前のリビジョン 前のリビジョン
次のリビジョン
前のリビジョン
次のリビジョン 両方とも次のリビジョン
index:source [2018/12/29 16:43]
tk
index:source [2024/01/26 10:28]
tk [意味の分類体系]
ライン 1: ライン 1:
-====== 起点領域のクラス ======+====== 起点領域の意味クラス ======
  
-== 名詞的 ​==+===== 意味の分類体系 =====
  
-{{topic>​source:​domain:​N +index:​source}} ​+==== 意味分類の方針 ====
  
 +意味クラスの分類は『[[https://​clrd.ninjal.ac.jp/​goihyo.html|分類語彙表-増補改訂版データベース]]』(以下『分類語彙表』)を用いています。
  
-== 動詞的 ==+  * 『分類語彙表』の意味な階層分類は、より上位のものから、類/部門/中項目/分類番号/段落番号/小段落番号からなります。このコーパスでは便宜的に、『分類語彙表』の「類」をDomain、「中項目」をGroup、「分類番号」をSection、「段落番号」をClassとよんでいます。 
 +  * 本コーパスでは「段落番号」を意味クラスの最小単位 (Class) として、意味のアノテーションを行っています。コーパス内には10902個のClassページがあり、それぞれが上位のSection、Group、Domainに分類されています。 
 +  * Class1つには、平均して10語程度が含まれます。同じClassの語は似た意味を持っているため、具体性の高い意味分類のカテゴリーと考えることができます。
  
-{{topic>​source:domain:V +index:​source}}+以下のような方針で、具体的な用例の意味論的アノテーションを行っています。(参考: 
 +[[info:faq|意味分類の問題点は?]])
  
 +  * 起点領域の意味とは、テキスト本文に生起しているFocusの表現に近い語が含まれるClassであると考えます。
 +  * 目標領域の表現はコンテクストから推論できるStandardの表現に近い語が含まれるClassであると考えます。
 +  * [[index:​mapping]]は、起点領域のClassと目標領域のClassの対応関係であると考えます。
  
-== 形容詞的 ​==+==== 意味分類の例 ====
  
-{{topic>source:domain:A +index:source}}+  * Domainの例:[[source:1]] 
 +  * Groupの例:[[source:1.54]] 
 +  * Sectionの例:[[source:1.5410]] 
 +  * Classの例:[[source:​1.5410-15]]
  
 +最上位の分類であるDomainは4個で、「体」は主に名詞、「用」は主に動詞、「相」は主に形容詞、「その他」はその他の語彙からなる語が分類されています。
  
-----+以下は、起点領域として用いられるDomainごとのGroupのリストです。目標領域については[[index:​target]]を参照してください。
  
-起点領域の意味クラス一覧+===== 「体」 =====
  
-{{topic>index:source}}+{{count>source:1}}
  
-----+{{topic>​source:​1}}
  
-{{count>​index:​source}}+===== 「用」 =====
  
 +{{count>​source:​2}}
  
 +{{topic>​source:​2}}
  
 +===== 「相」 =====
 +
 +{{count>​source:​3}}
 +
 +{{topic>​source:​3}}
 +
 +===== 「その他」 =====
 +
 +{{count>​source:​4}}
 +
 +{{topic>​source:​4}}
最終更新: 2024/01/26 15:53