法政大学国際文化学部

情報リテラシーI,II

担当 重定 如彦

2008520

 

10回 インターネットとデータ

1.      ウェブブラウザで見ることのできるデータ

·           HTML以外のデータの閲覧

WWWのデータの大半はHTMLという形式でかかれたハイパーテキスト形式のデータですが、ウェブブラウザを使ってメモ帳などで作った普通のテキストデータ(プレーンテキストと呼びます)や画像を表示することができます。また、HTMLやテキストデータ以外のウェブブラウザが本来扱うことができないタイプのデータをブラウザを使って見ようとした場合、ブラウザは以下の3つのうちのいずれかの動作を行います。

Ø  自動的にそのデータを見るためのアプリケーションが実行される。このようなアプリケーションのことをヘルパーアプリケーションと呼ぶことがあります。

Ø  プラグインと呼ばれる仕組みを使って、ブラウザのウィンドウの中で表示する。

Ø  データをファイルに保存するためのパネルを表示する。この場合、一旦データをディスクにファイルとして保存し、そのデータを扱うことができるアプリケーションを使ってそのデータを見ます。

プラグイン(plug-in)は、ウェブブラウザを拡張するためのプログラムのことであり、プラグインを使うことで、ウェブブラウザが本来扱うことができないタイプのデータを表示することができるようになります。プラグインの例としては、音声付きの動画データを表示させる「フラッシュ」と呼ばれるものがあります。プラグインを使うためには、コンピュータにプラグインのプログラムをダウンロードしてインストールする必要があります。プラグインが必要なデータがあるウェブページには大抵必要なプラグインの入手方法が書かれているのでそれに従って各自プラグインを手に入れて下さい。

·           HTTP以外のプロトコル

WWWではHTTPというプロトコルを使ってコンピュータ同士がデータのやりとりを行いますが、インターネット上ではこれ以外にも様々なプロトコルが存在しています。多くのブラウザはHTTP以外のいくつかのプロトコルに対応しており、それらのプロトコルを使ってインターネット上のデータをやりとりすることができます。HTTP以外のプロトコルをブラウザで使うには、URLの最初の部分に「プロトコル名://」と記述します。

 

主なプロトコルとその意味を表にまとめます。(注:この中でfilemailtoは厳密にいうとプロトコルの名前ではありません。メールを転送するためのプロトコルはSMTPです。また、IEを使う場合はfile://を省略することができます)

プロトコル名

意味

http

WWWの標準的なプロトコルでハイパーテキストデータの転送に使用

https

暗号を使ったHTTP。データを暗号化して送る

ftp

ファイルを転送するためのプロトコル(file transfer protocolの略)

file

自分のコンピュータ上のファイルやフォルダを指定する際に使用

mailto

メールアドレスを指す。

URLのプロトコルをftpにした場合は、一般的に転送するファイルをディスクのどこに保存するかを選択するパネルが表示されるので、保存する場所を選択して下さい。

ウェブブラウザは一般にメーラアプリケーションと連動しており、URLのプロトコルにmailto書かれたリンクをクリックするとメーラアプリケーションが起動し、URLmailto://の後に記述されたメールアドレスにメールを書くためのウィンドウが開かれます。また、この時起動されるメーラアプリケーションは「ツール」「インターネットオプション」を実行し、表示されるパネル内の「プログラム」のタブをクリックして表示されるパネルの「プログラムの設定」ボタンで設定することができます。

2.      FTPを使ったデータの転送とVPN

インターネットを使ってデータを転送する方法の一つにFTP(File Transfer Protocol)を使ったファイルの転送があります。FTPを使ってファイルを転送するには一般にFTP用のソフトを利用します。例えば法政大学のコンピュータにはffftpというFTPのソフトがインストールされています。ffftpを使うことで、家庭のパソコンから法政大学のGドライブに対してデータを転送(ダウンロードやアップロード)することができます。ffftpのインストールや設定については利用ガイドの102Pを参照して下さい。また、VPNVirtual Private Network)を使って家から学校のパソコンに接続することも可能です。VPNの使い方については利用ガイドの89Pから詳しく書いてありますのでそちらを参照して下さい。

3.      データ圧縮

·           データ圧縮の必要性

インターネットの回線にはそれぞれデータの転送速度の上限があり、一定以上の速度でデータを転送することはできません。ネットワーク回線が1秒間に何ビットのデータを転送できるかをbps(bit per second)という単位で表します。学校や会社の場合、太い回線が用意されているので、100Mbps=1bps)以上という非常に高速にデータを転送できますが、家庭で電話回線などを使ってデータを転送した場合、一般的に使用されるモデムの場合は速くて64Kbps(=64000bps)ISDNの場合は128KbpsADSLの場合は数Mbps程度の速度でしかデータを転送できません。これらの数字は最大値であり、ネットワーク回線を一度に多くの人が利用すると転送速度はこれより下がってしまいます。

日本語が記述されたテキストデータを転送する場合はせいぜい文字数*2バイト程度の量なので回線速度はあまり問題になりませんが、画像データ、動画データ、音声データなどのマルチメディアデータはサイズが数メガバイトを超えることはめずらしくなく、それらのデータをインターネットで転送する為には時間がかかります。

練習問題:10メガバイトのデータを64Kbpsのネットワーク回線を使って転送した場合、最低何分かかるか計算してみましょう。なお、10メガバイトは1000万バイト、64Kbps64000ビット=64000/8バイト=8000バイトのデータを1秒間に転送できるとします。

この例からわかるように、ネットワークのデータ転送速度には上限があるため、巨大なデータをそのまま転送すると大量の時間が必要となってしまいます。また、コンピュータのハードディスクにも限りがあるため、巨大なデータはハードディスクを圧迫するという問題もあります。これを解決するために、データのうち無駄な部分を整理してデータのサイズを減らすという手法が使われています。これをデータの圧縮と呼びます。

·           画像データの仕組み

データ圧縮の例を挙げるために、まず画像データの仕組みについて説明します。コンピュータ上に表示されている画像は色のついた点(ピクセル、又はドットと呼ばれます)が集まってできています。それぞれの点の色は赤と緑と青(光の3原色)の組み合わせで表され、それぞれの色の明るさを3つの数字で表します。例えば明るさを0から100の範囲で表す場合、0はその色が全くない場合、100はその色そのものです。

100

0

0

50

0

0

暗い赤

0

0

0

100

0

100

100

100

100

 

この場合、一つの点を赤、緑、青の3つの1バイトのデータで表すことができるので、画像をコンピュータで表現するためには一つの点につき3バイトのデータが必要になります。例えば「A」という文字をコンピュータ画像で表した場合、5*7のサイズの画像の各点に以下のような配色をすることで表すことができます(空欄部分は白色を表します)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

この図の場合、点の数が5*735、一ドットにつき3バイトのデータが必要なので、35*3=105バイトのデータが必要となります。余談ですが、実際の画像データでは、一般的に赤、緑、青をそれぞれ0から255の範囲で表現します。それぞれの色につき256通りの表現ができるので、一つの点につき256*256*256=1000万色の色を表現できます。もちろんそれぞれの色を表す数字の範囲を広げれば(例えば0から1000まで)もっと細かく色を表現することも可能ですが、あまり細かく表現しても人間の目では区別できないので、約1000万色の色を表現できれば十分だと考えられています。

例えば、最近のディスプレイは1024*768のサイズの画像を表示することができます。1ドットのデータを4バイトのデータで扱うことが多いので、ディスプレイに表示された画像を表現するには、1024*768*4=300万バイト=3メガバイトのデータが必要となります。このようにたった1画面分のデータを表すだけでも3メガバイトもデータが必要なので、(特に低速な)ネットワーク回線で気軽に画像データを送ることは困難です。

·           課題1

640*480のサイズの画像を1秒間に60コマ分流す動画を、データを圧縮せずに3分間作ったとすると、そのデータサイズは何バイトになるかを計算せよ。また、そのデータを64Kbps及び8Mbpsのネットワーク回線を使った場合、転送するのに最低何分かかるかそれぞれ計算せよ。なお、動画データは1ドットにつき4バイトのデータを必要とし、64Kbpsのネットワーク回線は一秒間に8000バイト、8Mbpsのネットワーク回線は一秒間に1000000(百万)バイトのデータを転送するものとする。

·           画像データの圧縮法の例

これまでの例で、画像のようなデータはサイズが非常に大きくなるため、そのまま転送すると大変な時間がかかってしまうことが実感できたと思います。そこで、一般的には画像データは圧縮してデータのサイズを小さくします。画像データを圧縮するにはいろんな方法がありますが、ここではもっとも簡単な方法について説明します。上記の「A」という文字の場合、同じ色の点が複数並ぶという性質があります。このように同じ色で塗りつぶされている部分が多い画像(例えば漫画の絵など)は、点の色を一つ一つ表現するよりは、色がいくつ並んでいるかを表現するほうが効率よくデータを表現することができます。例えば先ほどの「A」の例の場合、一番上の行から右に見ていくと

2 1 3 1 1 1 1 1 3 7 3 2 3 2 3 1

のように16個のデータで表現することができます。それぞれについて色で3バイト、数で1バイトの合計4バイトのデータが必要なのでこの場合16*4=64バイトでこのデータを表すことができます。一つ一つの点の色で表現した場合は105バイト必要だったので、この方法によってデータを64/105=61%に圧縮することができます。この元のデータサイズと圧縮後のデータサイズの割合を圧縮率と呼びます。

実際に使われている画像圧縮技術としては、JPEGGIFPNG(それぞれファイルの拡張子が.jpg .gif .png)などがあります。これらはそれぞれ様々な方法で画像を圧縮し、画像の種類にもよりますが、平均して画像データを30%程度に圧縮できるようです。

·           課題2

 先ほどの「A」を左の列から順に縦方向に色がいくつ並んでいるかを数えた場合、どのように表されるかを記述し、それが何バイトのデータで表されるかを計算せよ。

·           その他のデータの圧縮法

文字の場合の圧縮法についても簡単に例をあげてみます。例えば英語の文章では良く使われる単語とそうでない単語があります。例えばthe, this, that, is, are, what, where…  などの単語は非常に良く使われます。これらの良く使う単語を表にして、それぞれを一つの数字で表せば文字データを圧縮することができます。

例えば全部で10000文字の英文の中に「the」という単語が50個でてくる文章があったとします。この文章を普通に表せば10000バイトのデータが必要ですが、theという文字を1という数字に置き換えてやれば、3文字の「the」が1文字の「1」に置き換わるので全体で(3−1)*50=100バイトのデータを節約することができます。

文字やプログラムなどを圧縮する技術としてはLHAZIP(圧縮ファイルの拡張子は.lzh .zip)があり、これらは上記の方法以外にも様々な工夫をこらして圧縮を行っています。なお、圧縮方法には向き不向きがあり、向いていない方法で圧縮しようとしても良い結果が得られない場合があるので注意が必要です。例えば画像圧縮技術は画像の特徴を使った圧縮を行うので文章データなどを圧縮しても良い圧縮率は得られません。

·           データの圧縮・解凍方法

 圧縮したデータは通常そのままでは使えず、元のデータ形式に戻す必要があります。この作業を解凍と呼びます。(ブラウザの場合、JPEGなどで圧縮された画像データをそのまま見ることができますが、実際にはブラウザのプログラム内で一旦データを解凍してから表示しています)。データの圧縮・解凍を行うには、圧縮・解凍ソフトを使用します。法政大学のコンピュータには+LhacaというLHAZIPという形式でデータを圧縮・解凍可能なソフトがインストールされているので、その使い方について説明します。

データを圧縮するには、デスクトップのIconフォルダ内にある+Lhacaのアイコンをダブルクリックしてソフトを実行して下さい。そして、圧縮したいファイルをドラッグして+Lhacaのウィンドウ上にドラッグするとそのファイルが圧縮され、デスクトップ上に圧縮されたデータが格納されたファイルが作成されます。このとき、フォルダをドラッグすると、フォルダの中身がすべてまとめて一つのファイルに圧縮されます。

圧縮されたデータを解凍するには、圧縮されたファイルをダブルクリックします。すると自動的にデータが解凍され、デスクトップ上に解凍したファイルが格納されたフォルダが作成されます。電子メールの添付ファイルやFTPを使ってインターネットで大きなサイズ(電子メールの場合は1メガバイトを超える場合)のデータを転送する際には、圧縮・解凍ソフトを使ってデータサイズを圧縮してから送るように心がけて下さい。

·           圧縮・解凍ソフトのインストール

 通常、購入したばかりのコンピュータには圧縮・解凍ソフトはインストールされていないので、圧縮・解凍操作を行うには圧縮・解凍ソフトをインストールする必要があります。インターネット上にはいろんな圧縮・解凍ソフトのフリーソフトが存在していますので、自宅のコンピュータで圧縮・解凍作業を行うにはサーチエンジンなどを使って探してインストールして下さい。また、それぞれのソフトによっては使い方が若干異なりますので、詳しい使い方については付属のマニュアルを読んで下さい。

·           課題3

圧縮技術について3つ以上調べその特徴(どのようなデータを圧縮するのに適しているか、圧縮率はどのくらいか)を述べなさい。なお、圧縮技術のうち一つは必ず動画の圧縮技術を含めること。

4.      インターネットと文字コード

コンピュータで文字を表現するには、文字とその文字をコンピュータで表現する数字の対応を定めた文字コードを使います。現在コンピュータで使われている日本語の文字コードは実は1種類ではありません。代表的なものにはJISShift-JISEUCUnicodeの4つがあり、このうちShift-JISはマイクロソフトのWindowsで使われており、EUCJISUnix系のOSで使われています。Unicodeはこの中で一番新しい文字コードで、いろんな言語を使えることから最近広まりつつあります。

本当は日本語を表す文字コードは1つに統一したほうが混乱が少ないのですが、残念ながら現状では文字コードは統一されていません。ある文字コードで書かれた文章を別の文字コードだと勘違いして文章を表示しようとすると全く意味のわからない文章が表示されてしまいます。これを文字化けと呼びます。WWWの場合、多くのウェブページには自分のデータがどの文字コードで書かているかが明示されているので、ブラウザはその情報を使って画面に文字を表示します。また文字コードの情報が書かれていなかった場合でも、かなりの精度で文字コードを自動判別することができます。しかしこの判別がうまくいかなかったり、ウェブページの文字コードの情報に間違った内容が書かれていると、ブラウザは正しくウェブページの内容を表示できず、文字化けをおこします。

 

もしブラウザを使って文字化けが起こった場合は、「ページ」「エンコード」で表示されるサブメニューをいろいろいじってみて下さい。それでもうまく表示されない場合は別のブラウザで見ると正しく表示できる可能性があります。

5.      インターネットと犯罪

·           クラッカー(cracker)とハッカー(hacker)

インターネットの普及によって家や学校にいながらにして、世界中の情報を手に入れることができるようになりましたが、その反面インターネットを使った犯罪が急上昇しています。インターネットを使って他人のコンピュータなどに侵入し、貴重なデータを盗んだり悪用したりする人のことをクラッカーと呼びます。テレビなどではそのような行為を行う人のことをハッカーと呼ぶことがありますが、ハッカーはプログラムを解析して手を加える人の事です。アメリカなど外国ではハッカーは優秀なコンピュータ技術者のことを指し、決して悪いイメージはありません。これが日本のマスコミの勘違いによってハッカーといえばコンピュータを悪用する人というイメージが植え付けられたようですがこれは誤用です。外国でこの誤用をすると相手を侮辱したりする可能性があるので注意して下さい。

クラッカーの語源のcrackとは破壊するという意味があります。クラッカーの犯罪には様々なものあります。例えば組織の内部からの犯行の例としては、以下のような犯罪が実際に行われた例があります。

Ø  顧客の情報を管理するコンピュータプログラムの作成を請け負って、そのプログラムに自分だけが顧客の情報をこっそりと手に入れるようにする。

Ø  銀行の口座を管理するプログラムの利子の計算部分に細工し、利子の計算の四捨五入を切り捨てに変更し、差額を自分の講座に振り込むようにする。

 また、外部からの犯行例としては、以下のようなものがあります。

Ø  政府のウェブサーバに進入し、ウェブページの内容を勝手に書き換えてしまう。

Ø  企業のコンピュータに進入し、企業秘密などの重要なデータを盗む

内部からの犯行の場合に対しては社員の管理体制や雇う側の人を見る目が重要になりますが、外部からの犯行は外部からの進入を許さないように気をつける事が重要です。

インターネットが家庭に普及したことによって、家庭のパソコンもクラッカーの攻撃の対象になっています。最近では家庭でもADSLや光通信などを使って一日中コンピュータをインターネットにつなぎっぱなしにしているパソコンが多くなっており、そのようなパソコンは一度進入に成功すると長い間悪用できることや、個人のパソコンはセキュリティに対する認識が甘いことからクラッカーの攻撃対象となっています。家庭のパソコンが狙われた場合のコンピュータの悪用例としては以下のようなものがあります。

 

Ø  モデムを使ってインターネットに接続している場合、接続先を勝手に外国のプロバイダに変えてしまい、後でとほうもない電話料金を請求される。

Ø  コンピュータに進入され、個人情報を盗まれる。また、進入したコンピュータを隠れ蓑にして別の犯罪行為を行う(勝手にその人のメールアドレスを使って悪意のあるメールをばらまく、企業などのコンピュータに進入しようと試みるなど)。このようなことが行われると、まず追求の手が犯人ではなく、進入された個人に向かうことになり、場合によっては責任を問われることになります。

このような犯罪の手口は大きく、「パスワードを盗む」場合と「悪意のあるプログラムを進入させる」の2つにわかれます。パスワードを盗まれないようにするには、

Ø  簡単に類推することができるようなパスワードにしない。

Ø  パスワードを紙など他人の目にふれるような方法で残さない。

Ø  できればパスワードを頻繁に変更する。

ことが重要です。また、悪意のあるプログラムはコンピュータウィルスの一種なので、普段からコンピュータウィルスに対して以下のような注意をすることが重要です。

Ø  電子メールの添付ファイルは気軽に開けない

Ø  怪しげなファイルをインターネットからダウンロードして実行しない

Ø  ファイルを実行する前にウィルスチェックソフトでチェックする。

Ø  普段からウィルス情報をチェックしておく。

Ø  ウィルスに感染した場合に備えて重要なファイルはバックアップする。

 昔はクラッカーによる犯罪は主に企業などに対しておこなわれていましたが、最近では一般の人も危険にさらされています。また、クラッカーの被害は自分だけではなく、他人にも迷惑をかける可能性が非常に高くなっています。自分は大丈夫だという根拠のない思い込みをせずに、普段からくれぐれも気をつけるようにしておいて下さい。

·           課題4

犯罪に対処する方法の一つに、犯罪を行う側の立場に立って考え、それに対して対処を行うというものがあります。そこで自分がクラッカーになったと仮定して、他人のパスワードを相手に気づかれないように盗む方法を2つ以上考え、思いついた方法について述べて下さい。また、その考えた方法に対処するためには普段からどのようなことに気をつけなければならないかを考えその方法について述べて下さい。

 

出席、課題のメールは ta080017@mail.edu.i.hosei.ac.jp までお願いします。

質問のメールなどは、 sigesada@hosei.ac.jp までお願いします。

授業の資料の最新版は http://www.edu.i.hosei.ac.jp/~sigesada/ にあります。