Last Update 2013/06/20

日本語検索処理入門
電子化された情報を創造の糧に

鍵村 浩治 著
B5判 210ページ
定価2,420円(税込)
JAN9784789835824
1997年8月1日発行
[絶版2001.4.1] 日本語検索処理入門
大変恐縮ですが,こちらの商品は品切れ絶版となりました.
はじめに

 パーソナルコンピュータに関して, テレビやラジオで「マルチメディア」という言葉を耳にしないことが珍しい今日このごろです.そんななかで,「華やかな映像」や「心を震わす音楽」を伴わない文字認識はいかにも地味なテーマです.しかし,「文字」が文明の基幹をなしてきたこと,これからも「文字にとって変わるコミュニケーションツールが出現するとは思えない」ことを考えれば,「文字認識の電脳化」は社会にもっとも大きな影響を与えるテーマです. 文字がなかった場合,私たちの文化は継承されず,今日の繁栄はなかったことでしょう.
 このため,今後も文字処理の分野は筆者がもっとも発達してほしいと願っている分野なのです.コンピュータの理想の姿は創造活動のよき助手であり,よき相談相手となってくれる,人間にもっとも近い能力をもった機械に発達してほしいからです. 理想からすれば,現在のコンピュータはあまりにも不細工であり,あまりにも石頭で融通のきかない機械ですが,希望がかなう下地は生まれています.
 いまもっとも発達した文字処理はワープロというソフトに代表される,文章作成支援ソフトでしょう.また,画像認識分野が絡む,OCRソフトもかなりの認識率に達し,オフィスに導入されつつあります.個人がスキャナとOCRソフト購入しても,そのコスト以上の価値を創造できる時代です.
 電子化された情報の洪水が起こり,これらの情報がある人には役に立ち,ある人には役に立たないといった差別化が起こってきました.コンピュータは情報の蓄積能力にはたけています.しかし,情報をどのようにフォーマットして蓄積し,そのデータベースから必要としている情報をどのように効率的に取り出すかという問題に,これという決定打がまだ出ていません.
 創造は無から生まれません.旧約聖書風にいえば,「まず情報収集ありき」です.どの情報を集めるか,どの情報を捨てるかという具合に,その人にとって,どのような情報に価値規準があるか明確にした上で,情報摂取するのがプロフェッショナルですが,しかし,日常の私たちが書留めるアイデアストックは特定の目的があるわけではありません.思い付くままにメモる覚書き程度のものです.こうした日頃の記録を効率よくデータベース化する方法が「継続できるシステム」として構築できるかが大きな問題です.いかに優れているように見えるシステムでも,実行が伴わなければ役に立ちません.持続するデータベースから,容易に「創造の糧となるキーワード」を探り出し,「付加価値をつけて,新しい情報として発信していく」ための支援システムが生まれることを願いつつ……

目次

第1部 DOS環境の日本語処理プログラム
第1章 CとBasicの文字列処理関数の機能と使い方
 ●Cの文字列と整数型の関係
 ●QuickBasicの文字コード
第2章 CとBasicによるファイル入出力プログラムの基礎
 ●ファイルのアクセス方法
 ●バッファリング
 ●システム・コールを利用する
 ●コマンド・ラインの取得
 ●ファイル名の検索
第3章 日本語のテキスト検索関数のつくり方
 ●検索関数
 ●日本語の検索規則
 ●正規表現に対応する方法
第4章 ワープロや表計算ソフトのデータからテキストを取り出す方法
 ●ファイルの分類
 ●新松の文書ファイルの構造を解析する
 ●ロータス1-2-3のデータ・ファイル構造を解析する
第5章 多機能日本語検索プログラムのつくり方
 ●機能の結合と追加

第2部 Windows環境の日本語処理プログラム
第1章 C++プログラムの勘所
 (1)ストリームクラスの使い方
 (2)クラス定義とコンストラクタ
 (3)演算子のオーバーロード
第2章 Mojiクラスの使い方
 (1)Mojiオブジェクトの入出力
 (2)文字列ポインタとMojiオブジェクトの関係
 (3)Mojiオブジェクト同士の比較
第3章 MojiArrayクラスの使い方
 (1)MojiArrayオブジェクトのMoji出力の方法
 (2)指定文字の読み飛ばし出力の方法
第4章 KStringクラスの使い方
第5章 検索クラスの使い方
 (1)検索プログラム
 (2)置換プログラム
第6章 検索エンジンTXFINDxx.DLLの作り方
 (1)スタティックライブラリを作る
 (2)ダイナミックライブラリを作る
 (3)コンパイル&リンク時の注意点
 (4)他言語からDLLにアクセスする外部宣言の方
第7章 TXFINDxx.DLLの使い方
 (1)KInputBoxの使い方 TXFINDxx.DLL
 (2)KFileView使い方 TXFINDxx.DLL

Appendix テキスト検索アプリケーション

第8章 CGIプログラミング・ユーザーインターフェース CGIINTFA.DLLの作り方
 (1)CGIプログラムを作るとき,最低限必要となる作業
 (2)CGIINTFA.DLL
 (3)CGIINTFA.DLLの使い方
 (4)アンケート
 (5)デバッグ用コンストラクタの使い方

索引