index:source

差分

この文書の現在のバージョンと選択したバージョンの差分を表示します。

この比較画面にリンクする

両方とも前のリビジョン 前のリビジョン
次のリビジョン
前のリビジョン
次のリビジョン 両方とも次のリビジョン
index:source [2024/01/26 10:04]
tk 作成
index:source [2024/01/26 10:28]
tk [意味の分類体系]
ライン 1: ライン 1:
-====== 起点領域の意味一覧 ​======+====== 起点領域の意味クラス ​======
  
-{{count>index:source}}+===== 意味の分類体系 ===== 
 + 
 +==== 意味分類の方針 ==== 
 + 
 +意味クラスの分類は『[[https://​clrd.ninjal.ac.jp/​goihyo.html|分類語彙表-増補改訂版データベース]]』(以下『分類語彙表』)を用いています。 
 + 
 +  * 『分類語彙表』の意味的な階層分類は、より上位のものから、類/部門/中項目/分類番号/段落番号/小段落番号からなります。このコーパスでは便宜的に、『分類語彙表』の「類」をDomain、「中項目」をGroup、「分類番号」をSection、「段落番号」をClassとよんでいます。 
 +  * 本コーパスでは「段落番号」を意味クラスの最小単位 (Class) として、意味のアノテーションを行っています。コーパス内には10902個のClassページがあり、それぞれが上位のSection、Group、Domainに分類されています。 
 +  * Class1つには、平均して10語程度が含まれます。同じClassの語は似た意味を持っているため、具体性の高い意味分類のカテゴリーと考えることができます。 
 + 
 +以下のような方針で、具体的な用例の意味論的アノテーションを行っています。(参考: 
 +[[info:​faq|意味分類の問題点は?]]) 
 + 
 +  * 起点領域の意味とは、テキスト本文に生起しているFocusの表現に近い語が含まれるClassであると考えます。 
 +  * 目標領域の表現はコンテクストから推論できるStandardの表現に近い語が含まれるClassであると考えます。 
 +  * [[index:​mapping]]は、起点領域のClassと目標領域のClassの対応関係であると考えます。 
 + 
 +==== 意味分類の例 ==== 
 + 
 +  * Domainの例:[[source:​1]] 
 +  * Groupの例:[[source:​1.54]] 
 +  * Sectionの例:[[source:​1.5410]] 
 +  * Classの例:[[source:​1.5410-15]] 
 + 
 +最上位の分類であるDomainは4個で、「体」は主に名詞、「用」は主に動詞、「相」は主に形容詞、「その他」はその他の語彙からなる語が分類されています。 
 + 
 +以下は、起点領域として用いられるDomainごとのGroupのリストです。目標領域については[[index:​target]]を参照してください。 
 + 
 +===== 「体」 ===== 
 + 
 +{{count>source:1}} 
 + 
 +{{topic>source:1}} 
 + 
 +===== 「用」 ===== 
 + 
 +{{count>​source:​2}} 
 + 
 +{{topic>​source:​2}} 
 + 
 +===== 「相」 ===== 
 + 
 +{{count>​source:​3}} 
 + 
 +{{topic>​source:​3}} 
 + 
 +===== 「その他」 ===== 
 + 
 +{{count>​source:​4}} 
 + 
 +{{topic>​source:​4}}
最終更新: 2024/01/26 15:53