Weblio辞書辞典>辞書・百科事典>wordnet>wordnetの3ページ目
wordnetとは?
スポンサーリンク
アマゾンWordNet
アマゾンは常時無料配送/一部除く。本、洋書、雑誌、コミック
名詞のネットワーク構造は他の品詞と比べてはるかに深い構造を持っており、動詞は他の品詞よりもはるかに入り組んだ構造をしている。
形容詞ははっきり区別された別々の固まりに組織されており、副詞はそれぞれの語が由来する形容詞に従って定義されており、形容詞と似た構造をとっている。
WordNetの目的は、人間が言語を処理する方法について年月をかけて得られた知見と一致するシステムを開発することだった。
例えば失語症は患者が物の名前を思い出すのを選択的に(該当する物とそうでない物が入り交じって)妨げる状況を作り出すということが分かっている。
そのため、品詞をはっきりした階層構造へ分類する、より理にかなった分類方法が採られた。
下位語の場合、 人間が名詞の属性を見つけることのできる早さは、その特徴を定義している階層を見つける早さに依存していることが心理学実験で明らかになっている。
したがってカナリアは鳴き鳥の一種である(直下の下位語となっている)ため、人は「カナリアは歌う」かどうかをすぐに判断することができるが、 「カナリアは飛ぶ」かどうかを判断するにはもう少し時間がかかり(二層の隔たりがある)、「カナリアは皮膚を持っている」かどうかを判断するにはより多くの時間を要する(複数の階層の隔たりがある)。
これは、人間はある概念と他の似た概念を区別するのに必要なもっとも明確な情報のみを保持していることから、 人間がWordNetに似た方法で意味の情報を記憶しているということを示唆している。
他の辞書とは異なり、語源に関する情報はWordNetに含まれていない。
発音や不規則動詞についての説明はごく簡単なものにとどまっている。
辞書編集上の意味の情報は編集用のファイルにおいて管理されており、grind と呼ばれるツールによって配布用のデータベースを生成する処理が行われている。
grind と編集用のファイルも自由に利用することができるが、それでもデータベースの変更を行うことは難しい。
WordNetでは似た意味の単語を単一の一般的な定義によるsynsetにまとめているため、個々の単語の定義は必ずしも正確ではない。
EuroWordNetプロジェクトはそれぞれ相互にリンクされたヨーロッパの言語のWordNetを開発しているが、フリーのライセンスで利用することはできない。
Global Wordnetプロジェクトは 全ての言語WordNetを接続し、統合を行おうとしているプロジェクトである。オックスフォード英語辞典(Oxford English Dictionary)の出版社のオックスフォード大学出版は独自のWordNetをオンライン上で構築することを発表している。
2009年には日本語WordNetが英語WordNetと同じライセンスで公開された。[1]
eXtended WordNetはテキサス大学ダラス校のプロジェクトである。
WordNetの注釈を意味的に解析し、定義に含まれる情報を知識処理システムで利用可能とすることでWordNetを改良することをねらっている 。
eXtended WordNetはWordNetと似たライセンスで自由に利用することができる。
GCIDEプロジェクトはパブリックドメインの1913年版のウェブスター辞典をWordNetの単語の定義およびボランティアによって提供された情報と組み合わせた辞書を作成している。
これはコピーレフトライセンスのGPLで公開されている。
名詞のsynset間の上位語・下位語の関係は概念のカテゴリ同士の特化した関係として理解することができる。
言い換えれば、WordNetは情報科学における意味での、語彙のオントロジーとして用いることができる。
しかし、こうしたオントロジーは非常に多くの意味的な不整合、たとえば、(1)排他的なカテゴリ付けを行うために多数の語句をまとめて限定的な意味を付与していることや(2)意味付けの階層構造に冗長性があるため、通常、使用される前に修正が行われる。
さらに、WordNetを知識表現に利用可能なオントロジーに変換するには、通常 (1) WordNet上で行われている意味付けをsubtypeOfとinstanceOfの関係に区別して記述することと、 (2) 一意の識別子をそれぞれのカテゴリに関連づけることを必要とする。
このような修正と変換は⇒『integration of WordNet 1.7 into the cooperatively updatable knowledge base of WebKB-2』に記されている例があるが、ほとんどのプロジェクトはWordNetを知識処理アプリケーション(知識情報処理による情報検索等)に再利用する場合には単純にWordNetそのものを利用する方法を採っている。
WordNetはWordNetのカテゴリと他のオントロジーに由来するカテゴリとの写像にも広く利用されている。
たいていの場合、WordNetの最上位レベルのカテゴリのみが写像に用いられるが、オントロジーSUMOの作者は WordNetのsynset(名詞、動詞、形容詞、副詞)とSUMO classとの写像を作成した。
2006年現在の写像はSUMOを拡張したMId-Level Ontology (MILO)の特定の用語へのより多くのリンクを提供している。
OpenCycの上層のオントロジーにはWordNetのノードにリンクが設定されている。
スポンサーリンク
アマゾンWordNet
アマゾンは常時無料配送/一部除く。本、洋書、雑誌、コミック
楽に探せる!楽ワード
ページ(3/4)
≪前ページ
|
次ページ≫