|
![]() |
これは「第一弾」で公開したスクリプト群をUNIX環境に移植したものです。
とは言え、総てのスクリプトを移植したわけではありません。逆に、第一弾に
はなかった機能を加えた部分もあります。
一応、密かに公開しますが、あくまで暫定版ということで…
何故、暫定なのかと言うと、フォントに変なことをしてるからです。
動作確認は、Solaris 2.6 と TurboLinux 3.0, 6.0 で行なっていましたが、 近頃は VineLinux 2.6 あたりを主に使っています。
以下、それぞれの項目の中で注意すべき点は説明しますが、全体に亙る
留意点として、スクリプト内で指定するファイルの位置について
述べておきます。1.1 【パスの指定】
添付のスクリプト内には、リダイレクト先など、ドライブやディレクトリ
の指定が必要なところが多々あります。これは、それぞれのマシンの設定
状況によって違いますので、自分の環境に合わせて入出力先を変更して
おかないと、うまく行かないことがあります(大抵はうまく行かない)。
このマニュアルに従って実行する前に、必ず確認をして下さい。
こうした面倒なパスの修正をなるべく軽減する為に、以下の環境変数を使用します。
TEMP (作業ファイルを置く場所)
MNGPATH (スクリプトなどが置いてある場所)
csh系のシェルならば、~/.cshrc などに
setenv TEMP=/home/chigen/work/
setenv MNGPATH=/home/chigen/mongol
などと書いておくとよいでしょう。そして、$MNGPATH にパスを通しておけば使い勝手が良くなります。
set path=( $path /home/chigen/mongol )
sh系のシェルならば、~/.bashrc などに
export TEMP='/home/chigen/work/'
export MNGPATH='/home/chigen/mongol'
などと書きます。パスも同じように
export PATH='$PATH:/home/chigen/mongol'
のようにしておきます。
なお、TEMP は一般に使われる環境変数ですので、他のプロセスが利用する
ことも十分にあり得ます。TEMP内に謎のディレクトリなどができていても、
それは「電子化計画」とは無関係ですので念の為。
DOS で書いたスクリプトとの整合性を保つ為に、パスの最後に
スラッシュがあったりなかったりします。
$TEMP は /マーク付き
$MNGPATH は /マークなし
例
× setenv MNGPATH=/home/chigen/mongol/
○ setenv MNGPATH=/home/chigen/mongol
次に、スクリプト内でのパス指定を修正します。
具体的には、
期待した通りに動かない場合は、まず、このパス関係
を疑ってみて下さい。
パスを各自で修正する必要のあるファイル
PERL スクリプト
amdic.pl
cadic.pl(移植せず)
mdic
nadic.pl(移植せず)
〜ext.awk という名前のファイル
(移植せず)
divc_ext.awk
divm_ext.awk
inv_ext.awk
mark_ext.awk
ttf_ext.awk
ttfc_ext.awk
undivext.awk
その他
spldic_m.bat(移植せず)
spldic_c.bat(移植せず)
jdic.awk
(これは日本語つきの辞書
がないと無意味です。)
(移植せず)
モンゴル語電子化計画は、ネットワーク上で簡単・無料で手に入る、幾つ
かのツールを前提にしています。具体的には、
AWK , SED , PERL , GREP などです。いずれも
有名なものばかりですので、聞いたことがない人は、その手のことに詳し
い人に訊いてみて下さい。1.2 【本パッケージ以外に必要なファイル】
一言で説明するなら、
SED とは、文字列を置換するもの。
です。これは極めて乱暴な要約ですので、「違う」と言う人もいるでしょう。
しかし、とりあえず、これくらいの理解で構いません。
一般的なUNIXシステムなら、改めてこうしたツールを求めなくても、初めか
ら使えるようになっている筈です。但し、それがマルチバイト対応のものであ
るかどうかは、なんとも言えません。
GREP とは、文字列を検索するもの。
AWK と PERL は、文字列を加工するもの。
公開している辞書データの大部分は ASCII文字で書かれていますが、綴りの
乱れなどについての注釈を日本語で書き込んだ部分も若干ながらあります。日
本語はマルチバイトですので、マルチバイト文字対応のものでないと期待
通りに動作しない可能性があります。
なお、このマニュアルを読んでいるのは日本語環境にいる方が大半でしょう
し、私は日本語環境以外のマルチバイト文字環境を知らないので、「マルチバ
イト文字対応」と「日本語対応」というのを同義と見做します。(中国語環境
とかは判らない、ということです。)
私が使用しているものは、
GNU Awk 3.0.4 + multi-byte extension 1.12
Copyright (C) 1989, 1991-1999 Free Software Foundation.
GNU sed version 3.02 + multi-byte extension 1.08
Copyright (C) 1998 Free Software Foundation, Inc.
perl version 5.005_02
Copyright 1987-1998, Larry Wall
grep (GNU grep) 2.3
です。
Copyright (C) 1988, 1992-1998, 1999 Free Software Foundation, Inc.
また、この他に日本語の文字コード変換ツールとしてqkc を使っています。
qkc は一般的なUNIXシステムに常に入っているというものではありません
。別途 ftp 等で入手されるか、同等の機能を持つツールを使って下さい。
QKC − Quick KANJI code Converter C Version 1.0
Copyright (C) 1992 by K.Sato (佐藤公彦)
【著作権・版権の問題、及び免責に
ついて】で触れた様に、検索システムは元はWebsterの辞書用に作られた
ものをモンゴル語用に手直ししたものです。元の形では索引ファイルを作るに
はPERLだけあれば良く、AWKは必要なかったのですが、私はPERLのpの字も知ら
なかったので、モンゴル語辞書用に改変する時に、やむなくAWKとSEDで書き直し
ました。(書き直したというより、全く別のものを作ったという方が正確。)
今回、UNIX に移植するにあたり、索引ファイル作りの心臓部を PERL で
書き直してみました。本当なら、これで AWK も SED も必要なくなる筈なの
ですが、使い慣れたツールを手放し難く、結局必須ツールとして残してあり
ます。
| mkidx |
| mkaimai |
| ad WORD |
-MNKANAME_mng-Fixed-Medium-R-Normal--12-110-75-75-C-60-JISX0201.1976mng-0 -MNKANAME_mng-Fixed-Medium-R-Normal--12-110-75-75-C-120-JISX0208.1983-0という名前をつけてありますので、仮想端末の設定の参考にして下さい。
-Misc-Fixed-Medium-R-Normal--14-130-75-75-C-70-JISX0201.1976mng-0という名前です。
kterm -fr -mnkaname_mng-*-*-*-*-*-*-*-*-*-*-*-jisx0201.1976mng-* \
-fkB -mnkaname_mng-*-*-*-*-*-*-*-*-*-*-*-jisx0208.1983-* \
-km sjis
みたいな感じで kterm を起動すれば、モンゴル語と日本語が同時に表示でき
る環境になります。aliasにするなり、ウィンドウマネージャのメニューに入
れるなりすれば、起動も簡単でしょう。
|
| adv WORD |
モンゴル語を印刷したい人は、Infosystem Mongolei から
MonTeX を拾って来て使うといいと思います。こんな素晴らしいものが
できたので、第一弾で公開した印刷関係はUNIX環境に移植しません。
もっとも、MonTeX は独特の転写方法を採用していますので、これまで入力
したデータをそのまま流し込むわけには行きません。
とりあえず、モンゴル文字の変換スクリプトを作りました。キリル文字は最近
使っていないので、おいおい作ることにします。
| \ | ファイル名 | 内容 |
|---|---|---|
| 辞 書 検 索 関 係 | ad | 曖昧検索シェルスクリプト |
| adv | 曖昧検索シェルスクリプト(モンゴル文字表示用) | |
| mdic | 通常検索perlスクリプト | |
| mkidx | 通常検索索引作成シェルスクリプト | |
| mkaimai | 曖昧検索索引作成シェルスクリプト | |
| amdic.pl | 曖昧検索用部品 | |
| mkaimai_euc.sed | 曖昧検索用部品 | |
| mdidx.awk | 通常索引作成用部品 | |
| mkidxcrl.pl | 通常索引作成用部品 | |
| mkidxmng.pl | 通常索引作成用部品 | |
| モ ン ゴ ル 文 字 表 示 関 係 | cgn2dsv_euc.sed | adv用部品(キリル文字部分) |
| crf2dsv_euc.pl | adv用部品(モンゴル文字部分) | |
| ad_dsv_euc.sed | adv用部品 | |
| knmhn12mng.pcf.gz | adv用圧縮フォント(半角) | |
| knmzn12mng.pcf.gz | adv用圧縮フォント(全角) | |
| mischn14mng.pcf.gz | adv用圧縮フォント(半角) | |
| knmhn12mng.bdf | adv用フォント(半角。pcf化する前のもの) | |
| knmzn12mng.bdf | adv用フォント(全角。pcf化する前のもの) | |
| mischn14mng.bdf | adv用フォント(半角。pcf化する前のもの) | |
| そ の 他 | crf2mtex.pl | corff式転写をMonTeX用に変換するスクリプト |
| md_unx_j.htm | このファイル | |