2018年8月11日

アルシディア辞典の計画

現行の俗アルカ辞典に代わる、アルシディア辞典を開発中ですが、それについての計画をまとめておきます。

全体のコンセプト

俗アルカ辞典に続き、ユーザーによる編集が可能なオンライン辞書サイトとし、俗アルカ辞典の役割を置き換えることを目的とします。
アルカ専用ではなくカルディアの多種の言語に対応します。。
記述する言語を日本語以外にも対応し、例えば幻英辞典や幻幻辞典のようなものも作れるようにしたいです。

辞書のデータ型式

幻日辞典から続く、機械で扱いにくい型式をやめて、OTM-JSONのような機械で扱いやすい型式にしたいです。
これは現在のところ、JSONをベースにした独自型式で実装済みですが、その型式はまだ確定ではありません。

単語の編集画面が、訳語タグ、訳語、関連語などの項目ごとに細かく分かれることになります。
入力ミスが起きにくくなる代わりに、新規造語などで書く量が多い時は、入力欄の間を移動する操作が必要になり面倒になるので、対策が必要かもしれません。

正幻項目と俗幻項目の統合

俗アルカ辞典では、幻日辞典から引き継いだ「正幻」の項目と、俗アルカ辞典で作られた「俗幻」の項目が区別されています。
もともと、俗アルカ辞典では幻日辞典への追記のみを行うコンセプトだったので分離され、俗幻の項目のみ編集ができましたが、後に正幻の項目も編集できるようになりました。
現在ではひとつの単語の編集履歴が2種類あることになり、また正幻の項目に俗幻で追記したものを、統合して表示するなど煩雑な処理がされています。
これを統合し、ひとつの編集履歴・項目として扱うようにします。(実装済み)

同音異義語

幻日辞典では、同音異義語をin, in(2), in(3)のように項目名を変えることで表していました。
これはもともとPDICで、全く同じ見出し語の項目を複数作れないことが理由です。
しかし、同音異義語のうち一つを削除すると番号に欠番が出て、番号を付け直すために他の単語も編集することになったりしました。
同音異義語の()をなくし、自動的に割り当てた単語ID(数字)によって管理します。(実装済み)

全角英数字の廃止と本文中でのアルカを表す記号

幻日辞典では、アルカを半角英数字、英語などの他言語を全角英数字で表していました。
これは、特に幻日辞典を使うのに慣れていない利用者に不親切であり、またUnicodeでは、全角英数字は半角英数字の互換文字になっているため、積極的に使うものではありません。
そこで、英語なども半角英数字に統一し、アルカを、例えば {{ }} などで囲んで表そうと思います。

アルカを示す囲み記号は、見出し語欄や関連語欄などの、アルカであることが明らかな欄では必要ありません。日本語で書く説明文の一部にアルカを含める場合に、囲み記号を使います。
アルカの範囲を示すのは、その部分のみフォントを変えたり、自動リンクにしたりできるようにするためです。

一方で、今までの幻日辞典に慣れている編集者や、新規の編集者などが、囲み記号を付けるとこを忘れる可能性があるというデメリットがあります。
凪霧の辞書では {{ }} は凪霧であることを表し、ルティア語の辞書では {{ }} はルティア語であることを表します。アルカの辞書内でも {{lt| }} などでルティア語を明示できるようにもしたいです。

上記のものをもっと進めて、Wiki記法のようなものが使えるといいのかもしれません。

語源欄と外国語欄

幻日辞典にある、語源欄や外国語欄は表記法が複雑で、かつ機械処理がしにくいものです。
これを構造化することで、語源欄をある程度自動で書いたり、単語編集時に、それによって影響を受ける派生語をリストアップすることができるようになります。
外国語欄は関連語欄に移した方がいいかもしれません。

関連語欄の相互参照

単語Aの関連語欄に単語Bを書くと、自動的に単語Bの関連語欄に単語Aが書かれるようにしたいですね。
位相の違う同じ意味の単語の対応も、現在は訳語欄で書いていて一方通行ですが、関連語欄に移したいです。

ファイルの添付

俗アルカ辞典では単語の項目に画像を付けることができますが、1つの単語につき1枚だけであり、また画像の操作は管理者にしかできません。
そこで、複数枚の画像や、画像以外の添付データも、ユーザーからのアップロードで扱えるようにしたいです。
その場合、セキュリティとかに結構気を使わないといけないのでしょうか。

派生語

俗アルカ辞典では、inat で検索すると、「もしかして動詞inの過去形(~した)?」のように、in で検索するリンクが出ます。
その手間を省いて、 inat の検索結果に in の単語そのものを表示するようにしました。(実装済み)
もう少し機能の範囲を広げて、単語それぞれが、規則的あるいは不規則的に、子見出しを持てるようにしたいです。

高度な検索

俗アルカ辞典では、検索のしかたが完全一致検索と、正規表現での検索しかありません。
これまでと同じような簡単な検索画面に加え、高度な検索を正規表現などを学ばなくても使えるような検索画面を作りたいです。

編集履歴

俗アルカ辞典の編集履歴は引き継ごうと思います。

単語の編集履歴に、作成・編集・削除だけでなく、他単語からの分割、他単語への統合の情報を記録したいです。

スレッドタグ

単語の編集履歴はスレッドのようになっており、その単語についての議論が行われることがあります。
そこで、単語(スレッド)ごとに、「議論中」などの、現在の状況を表すタグをつけ、タグ付きの単語を一覧できるようにしたいです。
造語依頼の機能も、「造語依頼」タグを使ったものになります。

ログイン

俗アルカ辞典では、編集権限が必要な場面で毎回ユーザー名とパスワードを入力しますが、一般的なサービスのようにログイン・ログアウトする方式にしたいです。
そうすることで、ユーザーごとに、アルカの文字を幻字で表示するかラテン文字で表示するか等の設定もできます。

例文データベース・百科辞典

幻日辞典の例文は、その文の特に重要そうな単語の例文欄に入れていますが、その基準が分かりにくいため、例文データベースを別のサイトとして用意し、例文はそちらに移したいです。
幻日辞典では文化欄として、百科辞典的な記述がありますが、特に長い文化欄は、辞書としてと利便性を下げていると思うので、別の百科事典サイトを用意し、そちらに移したいです。
その上で、アルシディア辞典はその2サイトとしっかり連携するようにしたいです。

まとめ

全部をやろうとすると多分永久に完成しないので、まず使えるようにしてから、便利な機能や拡張的な機能を付けていきたいですね。

意見とかあれば下さるとうれしいです。

0 件のコメント:

コメントを投稿