!!! 関連項目 * [[外国語annotation]] * [[φik(sg)]] * [[誤入力の宴@SKK]] !!! annotation の概略 2000 年に SKK辞書の書式が拡張されました。簡単に言うと、候補の後に続く''';'''の文字から後、次の候補の始まりを示す'''/'''までが註釈 (annotation) として扱われます。 下記の例で言うと「マトを射ていること。適確と同義。」、「条件に当てはまること。」、「的確と同義。」がそれぞれ annotation の部分です。 てきかく /的確;マトを射ていること。適確と同義。/適格;条件に当てはまること。/適確;的確と同義。/ その書式と利用について、詳しくは、SKK Openlab ML の[この記事|http://mail.ring.gr.jp/skk/200010/msg00062.html]から始まる議論、及び SKK manual の[該当セクション|http://openlab.ring.gr.jp/skk/skk-manual/skk-manual-ja_5.html#SEC107]をお読み下さい。 annotation をサポートしない SKK プログラム (例えば SKKIME など) で利用したいときは、註釈部分を取り除いた SKK-JISYO.L.unannotated などをご利用になるか、[unannotation.awk|http://openlab.jp/skk/skk/tools/unannotation.awk] を利用して annotation を削除して下さい。 !!! annotation 規格化のための覚え書き 全体的統一によって見易さを高める、annotation を利用した拡張を可能にする、各自の需要に応じた annotation だけを抽出して利用できるようにするなどの目的のためには、annotation をある程度規格化することが必要となってきます。 ここでは、現況での annotation の付けられ方や、今後望まれる規格化のためのアウトラインを試案として説明しています。(加筆大歓迎) L辞書をご利用になる時、また、新規の[登録希望|http://openlab.jp/skk/registdic.cgi]を出す際や、annotation の加除編集をなさる際には参考にして頂ければ幸いです。 ;; は、特にその記号が排他的に使われる(べきである)ことを示しています。例えば、「※」は「正しくないが意図的に残されている」ペアを明示するためだけに使われるべきであり、単なる注意の喚起に使ってしまっては用をなさなくなります。 ::; :::";" を annotation に含めることは出来ません。[フォーム|http://openlab.jp/skk/registdic.cgi]に新しいペアの登録希望を出す際に、「用例等」欄の先頭に ";" を付ければ、自動コミットの際に自動的に取り除かれます。 :::先頭以外に ";" を付けた場合には自動では取り除かれませんが、コミッターへのサインとしては一応機能します。 ::* :::annotation 先頭のアスタリスクはユーザアノテーションのマークです。システムアノテーションはこれで始めるべきではありません。 ::‖ ::: 註釈として表示する意味はないが、辞書編集のためのコメントとしては必要な annotation にはこの記号が付けられています。okuri-ari エントリの okuri・品詞・[[活用情報|φik(sg)]]などがこれに当たり、辞書編纂用のスクリプトなどでは特別に扱われます。L辞書のものは SKK-JISYO.notes に分離されています。 :::("/||" で入力できます。) "" わたりあu /渡り合;‖ワ行五段[wiueot]/ ""(setq skk-annotation-function "" (lambda (annotation) (not (eq (aref annotation 0) ?‖)))) ::※ ::: 「正しくない」候補を意図的に残してある場合、annotation にその旨を※を付けて説明しています。 :::("/*" で入力できます。) "" やがい /野外/屋外;※「おくがい」の誤り/ "" ほしi /欲し;※送り位置補正/欲;非正則(ほs)/ ::? :::削除待ちの候補や、疑義があるが、誤登録なのかどうかの判断がついていない候補には annotation の末尾に半角の"?"が付けられています。 :::"?"そのものは他の用途にも使われるので、抽出の際は /?$/ と末尾にある場合のみを対象にすると良いでしょう。(末尾に"?"を付けるのは) "" はんていきじゅん /判定基準/判定規準;?/ ::旧字,異体字,本字,非正則,呉音,慣用音,連濁 :::これらは誤りではありませんが、区別のために annotation を付与しています。 :::特別な記号というわけでもありませんが、annotation 抽出の際には有力なキーワードとなりそうです。 ""まなb /学/學;「学」の旧字/斈;「学」の異体字/ ""ほん /本/翻/反/飜;「翻」の異体字/奔;奔放/犇;ひし・めく/畚;もっこ/笨;粗笨/叛;(慣用音) 謀叛/ ::和製英語,和製語 :::abbrev ペアのカタカナ語のうち、和製語と思われるものにはその旨を表示しています。少数ながら和製仏語などもありますので、抽出の際は「和製」のみをキーワードにするのが良いでしょう。 ""adballoon /アドバルーン;和製英語(advertising balloon)/ ""juponpresser /ズボンプレッサー;和製語(trouser press)/ ;これは仏語と英語のチャンポン ::姓,名,人名 :::人名が[フォーム|http://openlab.jp/skk/registdic.cgi]からL辞書または人名辞書に自動コミットされた場合、annotation の先頭に品詞に応じて「姓」「名」「人名」と付与されます。 :::ただし、実際にはL辞書に含まれている人名の大半にはこれは付与されていません。 :::競合のあるエントリで、人名とそれ以外の言葉が混淆している場合、人名のブロックの先頭に来る候補に「人名」の annotation を添えて目印にしてあることもあります。 ""しゅうじ /習字/修辞/週次/集字/修二;人名/修司/修治/秀治/周二/秀司/修次/秀次/宗司/ ""「修二」以降は全て人名です。 ::フルネーム :::SKK-JISYO.fullname 由来のフルネームには全てこの annotation が付与されています。 ::地名 :::「人名」同様に、L辞書内の地名のうち、競合のあるものには「地名」と annotate してあります。「地名,○○」の形で、具体的にどこの地名かも記載しておくのが理想的です。 ""かんない /館内/管内/関内;地名,横浜/艦内/幹内/ ""しべつ /死別/士別;地名,北海道北部/標津;地名,北海道東部/標別/ :: :::正しいが、現代語では稀な表記です。 "" なe /萎/痿;/ ::NB: :::語の用法などに関する、「一歩踏み込んだ」注意事項です。註釈らしい註釈とも言えます。 "" ぬめr /滑;NB:「すべr」と同形/ "" たっきゅうびん /宅急便;[商標]ヤマト運輸 NB:商標でない表現は「宅配便」/ ::原義:, 字義: :::一部のエントリには、微妙な意味合いの差を説明するために原義や字義に遡った解説が添えられています。謂わば NB: の特殊形です。 :::(原義や字義は、現代での用法を決定的な形で制限するものではありません。) "" まかs /任;(字義:大事なものを持たせる)/委;(字義:力を抜いて好きにさせる)/ "" じゃっかん /若干;some/弱冠;原義:男子の20歳/ ::⇔ :::必要に応じて対義語が添えられている場合があります。 :::対義語変換をサポートする案が出されています。/⇔([^/(,‖ ]*)/ などの正規表現で取り出せるように記述してあればその際役に立つでしょう。 :::("<->" で入力できます。) "" いぜん /以前/依然;still.「-として」/已然;⇔未然/ ::= :::同義語、または別の読みです。原則として、現代語としてあまり一般的でない語・表記・読みの候補を、より一般的と思われる候補に結ぶ形で添えられています。 :::一般論として、純粋な意味での「同義語」は存在しません。微妙な語感等の違いには目を瞑って、現代語としてほぼ代替可能であるというくらいの意味合いです。 "" かずら /葛;つるくさ/蔓;=葛/鬘;(wig) =かつら/ "" 「蔓」は「葛」と同義、「鬘」は「かずら」とも読むが「かつら」の方がより一般的な読みと思われるということです。 ::≒ :::類義語です。(異体字等でなく)別の文字だが現代語での意味はほぼ同じ、という場合に多く用いられています。 :::("/=:" で入力できます。) "" のぞk /除/覗/覘;≒覗く/臨;≒覗く/ "" ゆゆs /由々/由由/忌々;≒由々しい/ ::→ :::「参照せよ」の記号です。入力しにくい候補に、より入力しやすい別の入力方法を添える目的で多く使われています。 "" なみ /波/並/浪/奈美/奈未/名美/奈巳/竝;「並」の旧字/〜;→なみせん/ "" なみせん /波線/〜/ ::< :::語源・由来を示す記号です。 "" だめもと /駄目元;「-で言ってみる」(<駄目で元々)/ "" げばぼう /ゲバ棒; /異父;-[兄弟姉妹]/ ""「異父兄」「異父弟」「異父姉」「異父妹」の略記 ::(無印) :::実際には大半の annotation には特に記号などは付与されていません。 :::同音異義語との区別を援ける・語の運用の補助になる情報を添えるなどの目的で、定義・用例・原語・原綴・[[外国語訳|外国語annotation]]などが広く付与されています。 ""かくりつ /確立;establish/確率;probability/格率;maximの訳語/格律/ ""かりゃく /嘉暦;年号(1326-29)/下略/ ::† ::: SKK で、特に誤入力の虞れが大きいと考えられる語の annotation にはこの記号が添えられています。具体的にどの語やエントリがそうなのかについての報告を募集しておりますので、[[ご協力をお願いします|誤入力の宴@SKK]]。 :::("/dagger" で入力できます。) //誤入力防止のための annotation のみに限定して表示させたいという需要を満たすために、無印の annotation のうち、特に同音異義語の変換ミス防止効果が高いものに[[何らかのマークを付けて抽出できるようにする|誤入力の宴@SKK]]ことが考えられます。 "" ないぞう /内蔵;†built-in/内臓;†organs/ "" たいしょう /対象;†target/大賞/大正;年号(1912-26)/大将/対称;†symmetry/対照;†contrast/大笑/大勝/隊商/対症;-療法/大詔/大捷/ ::[口][略語]etc :::語の属性・スピーチレベルや使用される領域などを[]で表示しています。 "" はらん /波乱;ひと-/波瀾;-万丈/葉蘭;[植物]aspidistra/波蘭;Poland/ !! 分類記号 "" せんもう /繊毛;[生物]cilium/線毛;[生物]pilus/旋毛;つむじ/譫妄/腺毛;[植物]glandular hair/剪毛/ annotation の先頭に、[]で語の分類を示す場合があります。 [write my essay|http://custom-essay-writing-service.org/faq.php] annotation に分類を添えるのは次のような目的があります。 *定義などがなくとも、「何に関する語か」の情報だけで判別には充分な場合も多い *分野などによる抽出やフィルタリングを可能にする **卑語・口語・新語等を事前にカット [essay writing companies|http://essaywritingservices.org/custom-essay-writing.php] **「生物用語」の「こうせい」、のような変換や、文脈による候補順の自動調整 以下に、現在使われている主な分類を抽出しました。 // stab !一般的 これらは語のカテゴリよりは性質を表わす標識です。 ,記号,非省略形,解説 ,[略語],略語,直後に、何の略語かを添えるのが望ましい。 ,[時事],時事用語,時事的な、新しい言葉。語としての生存期間が短かそうなもの。 ,[新語],,辞書にはないが使われている、新しい言葉一般。 ,[口],口語,文章語とは見做されない、「俗っぽい」言葉。また特に okuri-ari エントリでは口語入力に使われる候補。 ,[俗],俗語,[口]との区分は確立されていません。 ,[卑],卑語,特に下品と考えられる語。苦手な方は取り除いてしまうのも手でしょう。 ,[隠],隠語, ,[古語],,現代では使われない、主に古典などに出て来る語や読み。「古臭くなった語」ではない ,[文語],,現代では文語的表現と考えられる語や読み。 ,[漢語],, ,[中国語],,現代中国語。 !固有名詞 ,記号,非省略形,解説 ,[固有名詞],,固有名詞一般。 ,[企業名] ,[出版社名],,出版社名も企業名ですが別枠にしてあります。 ,[商標],,一般化した商標名には商標でない言い換え語を添えると役に立つでしょう。(eg.宅急便→宅配便) ,[漫画],,漫画のタイトルや人物名など。将来的には固有名詞辞書に移管するかも? ,[アニメ],,漫画に準ず。 ,[ゲーム],,漫画に準ず。 !スポーツ、ゲーム ,記号,非省略形,解説 ,[スポーツ] ,[ゴルフ] ,[バレーボール] ,[ボクシング] ,[野球],,野球用語は突出して多いようです。 ,[相撲] ,[陸上] ,[水泳] ,[釣り] ,[囲碁] ,[将棋] ,[麻雀] ,[競馬] ,[花札] !生物 ,記号,非省略形,解説 ,[生物],,生物(学)用語 ,[動物],,動物学用語、または動物名 ,[植物],,植物学用語、または植物名 ,[魚],,お魚の名前など ,[鳥],,鳥の名前など ,[園芸],,園芸用語。[生物]や[農業]との線引きは難しいようです。 ,[農業] ,[林学] !医学 ,記号,非省略形,解説 ,[医],医学 ,[解剖],,解剖学用語、特に体の部分の名称。 ,[生理],,生理学用語。 ,[生化学],,[生物]との境界は曖昧です。 //,[栄養学] [service essays|http://custom-paper-writing.com/editing-services] ,[薬学],,(まだ存在しません) ,[漢方],,漢方薬の名称など。 ,[精医],精神医学,精神医学・精神分析学・心理学。三つに分けても良いかも。 //,[心理学],,(まだ存在しません) !科学技術 ,記号,非省略形,解説 ,[科技],科学技術,分野に限定されない、科学技術関係の言葉。 ,[化学],,化学用語及び化学物質名。 ,[光学] ,[色彩学] !理工系 ,記号,非省略形,解説 //,[理] ,[物理] ,[電気] ,[電磁気学] ,[熱力学] //,[電子] ,[電算],コンピュータ, ,[情報],,情報科学用語。[電算]との境界は曖昧。 ,[数学] ,[統計] !地学・天文 ,記号,非省略形,解説 ,[地学] ,[地質] ,[地質年代] ,[地理] ,[鉱] ,[天文] !工学 ,記号,非省略形,解説 ,[建築] ,[機械] ,[電設] ,[土木] !言語関係 ,記号,非省略形,解説 ,[言語],,言語学用語。 ,[文法] ,[音声学] ,[修辞] ,[国語学],,日本語のみに適用される言語学・文法用語。 ,[部首],,部首名。 !歴史 ,記号,非省略形,解説 ,[史],歴史(学) ,[中国史] ,[世界史] ,[日本史] ,[律令制] ,[三国志],,マニアックな人名が多々ありますね //,[遊廓] !宗教 ,記号,非省略形,解説 ,[宗教],宗教一般,特定の宗教でなく、宗教や宗教学一般で使われる語。 ,[儒教] ,[論語] ,[イスラム] ,[キリスト教] ,[聖書],,聖書の用語、特に書名。 ,[印哲],インド哲学 ,[仏教] ,[密教] ,[陰陽道] !社会科学 ,記号,非省略形,解説 ,[法],,法学・法律用語。 ,[政治],,政治(学)用語。 ,[経済],,経済(学)一般 //,[株式] ,[金融] ,[相場],,株式等の相場用語。 //,[商業] ,[会計],,会計・簿記関係の言葉。 //,[商法] !人文科学 ,記号,非省略形,解説 ,[文学] ,[文学史],,([文学]と統合?) ,[哲学] ,[論理],,論理学用語。[哲学]や[情報]と重なる部分も多い ,[美学] ,[美術] //,[文化] ,[文化人類学] ,[民俗学] !芸能・芸術(伝統的) ,記号,非省略形,解説 ,[芸能] ,[歌舞伎] ,[浄瑠璃] ,[能] ,[俳諧] ,[茶道] ,[邦楽] ,[民謡] !芸能・芸術(現代) ,記号,非省略形,解説 ,[音楽] //,[枕詞] ,[写真] ,[映画] ,[彫刻] !その他 ,記号,非省略形,解説 ,[印刷] //,[製本] ,[料理] ,[服飾] !数の決まっているもの ,記号,非省略形,解説 ,[六輝],,先勝・友引・先負・仏滅・大安・赤口 ,[十干],,甲乙丙丁戊己庚辛壬癸 ,[十二支],,子丑寅卯辰巳午未申酉戌亥 ,[二十四節気],,立春・雨水・啓蟄…… ,[八卦],,乾兌離震巽坎艮坤 //