index:source

差分

この文書の現在のバージョンと選択したバージョンの差分を表示します。

この比較画面にリンクする

両方とも前のリビジョン 前のリビジョン
次のリビジョン
前のリビジョン
次のリビジョン 両方とも次のリビジョン
index:source [2019/01/28 17:57]
tk
index:source [2024/01/26 10:28]
tk [意味の分類体系]
ライン 1: ライン 1:
-====== 起点領域のクラス ======+====== 起点領域の意味クラス ======
  
-== 名詞的() ===+===== 意味の分類系 =====
  
 +==== 意味分類の方針 ====
  
-{{topic>​source:domain:体 +index:​source}} ​+意味クラスの分類は『[[https://​clrd.ninjal.ac.jp/​goihyo.html|分類語彙表-増補改訂版データベース]]』(以下『分類語彙表』)を用いています。
  
 +  * 『分類語彙表』の意味的な階層分類は、より上位のものから、類/部門/中項目/分類番号/段落番号/小段落番号からなります。このコーパスでは便宜的に、『分類語彙表』の「類」をDomain、「中項目」をGroup、「分類番号」をSection、「段落番号」をClassとよんでいます。
 +  * 本コーパスでは「段落番号」を意味クラスの最小単位 (Class) として、意味のアノテーションを行っています。コーパス内には10902個のClassページがあり、それぞれが上位のSection、Group、Domainに分類されています。
 +  * Class1つには、平均して10語程度が含まれます。同じClassの語は似た意味を持っているため、具体性の高い意味分類のカテゴリーと考えることができます。
  
-== 動詞用) ​==+以下のような方針で、具体例の意味論的アノテーションを行っています。(参考: 
 +[[info:​faq|意味分類の問題点は?]]
  
-{{topic>​source:​domain:​用 +index:source}}+  * 起点領域の意味とは、テキスト本文に生起しているFocusの表現に近い語が含まれるClassであると考えます。 
 +  * 目標領域の表現はコンテクストから推論できるStandardの表現に近い語が含まれるClassであると考えます。 
 +  * [[index:mapping]]は、起点領域のClassと目標領域のClassの対応関係であると考えます。
  
 +==== 意味分類の例 ====
  
-== 形容詞的(相) ==+  * Domainの例:[[source:​1]] 
 +  * Groupの例:[[source:​1.54]] 
 +  * Sectionの例:[[source:​1.5410]] 
 +  * Classの例:[[source:​1.5410-15]]
  
-{{topic>​source:​domain:​相 +index:​source}}+最上位の分類であるDomainは4個で、「体」は主に名詞、「用」は主に動詞、「」は主に形容詞、「その他」はその他の語彙からなる語が分類されています。
  
 +以下は、起点領域として用いられるDomainごとのGroupのリストです。目標領域については[[index:​target]]を参照してください。
  
-----+===== 「体」 =====
  
-起点領域の意味クラス一覧+{{count>​source:​1}}
  
-{{topic>index:source}}+{{topic>​source:1}}
  
-----+===== 「用」 =====
  
-{{count>index:source}}+{{count>​source:2}}
  
 +{{topic>​source:​2}}
  
 +===== 「相」 =====
  
 +{{count>​source:​3}}
 +
 +{{topic>​source:​3}}
 +
 +===== 「その他」 =====
 +
 +{{count>​source:​4}}
 +
 +{{topic>​source:​4}}
最終更新: 2024/01/26 15:53