nドキュメントの電子化 その1
¨ビットマップデータとしての電子化
紙の文章を電子化する最も簡単な方法で、スキャナなどを使って文章を電子画像に変換
改ざんが困難であるため、証拠としての保存や文化財としての保存に適している
画像で保存されるので、文字の検索などが不可能、または非常に困難
¨HTMLファイルとしての電子化
現在、インターネットで標準的に利用されているHTMLを使って文章を電子化する
世界中に広がったインターネットを利用することで作成した文書を即座に全世界に公開可能
テキスト形式でデータを保存するので、文字列の検索が可能
世界中に保存された膨大なHTML文章から求める情報を検索することが可能
しかし、テキストが何を意味しているかを判断することができないという欠点もある
例えば、2000という文字で検索を行うと「2000円」、「2000年」、「2000人」などが検索されてしまう