コンピュータハードウェアの構成(4)

モデム

モデム(modem ← MOdulator-DEModulator, 変復調装置)とはデジタルのデータを電気信号や光を変化させること(変調)によって表して送信する装置 (modulator, 変調装置) と、その逆を行なう受信装置(demodulator, 復調装置) の組合せからなる通信装置。

かつては、電話回線を伝わる音声信号を変化させることでデータを送受信する機能を持つモデムがよく用いられた。今でももちろん利用されることはある。まず、これについて説明する。

モデムは、

                              アナログ
                              電話回線
  コンピュータ <---> モデム <---------->  モデム <---> コンピュータ
               シリアル
               接続(外付けモデムの場合)

のような形で接続することにより、コンピュータどうしの通信を可能にする。ファクスの機能も持っているものは、ファクスモデムと呼ばれる。モデム経由でインターネットを利用することもできる。ただし、いわゆるブロードバンドの普及によって、家庭やオフィスからの利用は減った。携帯電話にモデムをつなぐ利用法もかつてはよく見られたが、携帯電話の業者が自前のインターネット接続サービスを提供するようになって、これも減った。しかし、モデムはノート型 PC などに最初から組み込まれた形でよく出荷されているので、アナログ電話回線用のモデムもしばらくは無くならないだろう。ノート型のPCのハードウェア仕様に「56kbps モデム内蔵」とよく書かれているのはこれである。

電話回線ではなく、ケーブルテレビ(CATV)のケーブルを利用したネットワーク接続サービスもある。また、電話回線を使うが、従来のモデムとは違う方法でデータを送る ADSL (Asymmetric Digital Subscriber Line) と呼ばれるサービスも普及している。そのようなサービスにおいて、コンピュータを回線に接続するための装置もモデムと呼ばれる。(音声信号を使わない場合でも、変調装置と復調装置はあるので、モデムと呼んで良いわけだ。) ただし、アナログ電話回線用のものと区別するためにケーブルモデムとかADSL モデムと呼ばれている。アナログ電話回線用のものは PC のカタログなどではよくアナログモデムと呼ばれている。

光の変化(変調)によって信号を送受信する光モデムというものもある。最近普通してきた光ファイバ通信では光モデムを使うわけである。光通信の場合、電気的なノイズが入り込む心配がないこと、干渉がないことから、高速な通信ができる。

干渉とは: 電気信号の場合、近くを通る信号線どうしで干渉が起こります。信号線 A を流れる信号の影響を受けて信号線 B を流れる信号が少し変化してしまう、ということが起きるのです。

通信速度とその単位

通信速度の単位は bps (bit per second, ビット毎秒, 「ビーピーエス」と読むことが多い) で、1bps とは、1秒あたり1ビット送信(または受信)する速度である。

電話線用の最も高速なモデムは 56 kbps (kilo bps,キロビット毎秒) 程度である。ただし、このモデムでは、送信・受信の両方で56kbps の速度が出るわけではない。送信は33.6kbps しか出ない。(通信速度の非対称性。)受信に関しては、接続先の ISP (インターネットサービスプロバイダ, インターネットへの接続サービスを提供している業者)がこの手のモデムに対応してくれている時だけ、56kbps の速度が出る。さらに、これらは最高速度であって、回線の状態が悪いときや、相手方(あるいはこちら)のコンピュータの処理が追いつかない場合にはもっと低い速度になってしまう。

ADSL やケーブルモデムの通信速度は最高数十Mbps といった程度(業者によって違う)である。

ADSL も通信速度に関して非対称性を持っている。すなわち、送信速度は受信速度よりずっと低速しか出ない。一般のユーザの場合、受信するデータ量のほうが送信よりもずっと多いので、これで十分なのである。ADSL の A の字は Asymmetric から来ているが、この語は「非対称」の意味である。非対称でないサービスもあり、その場合は A の部分が別の字に変わる。そこで、同様のサービスで一般的なものについては、総称して xDSL と呼ぶことがある。

LAN でよく使われている Ethernet(イーサネット) の通信速度は規格によって違っていて、一番古い 10BASE-T という規格で 10Mbps (mega bps, メガビット毎秒), 100BASE-TX 規格で100Mbps, さらに速い規格の 1000BASE-T で、1Gbps (giga bps, ギガビット毎秒, これは 1000Mbps に等しい) である。

さらに細かく言うと、10Mbps のイーサネットは半二重通信(half duplex)であるのに対し、100Mbpsでは全二重通信(full duplex)であるから、そこでも差がつく。半二重通信では、双方向に通信ができるが、同時に両方向に通信することはできず、片方向ずつ使うことになる(単線の鉄道のようなもの?)。全二重通信では、同時に双方向に通信できる。

これらはいずれも最高でこれだけの速度が出る、ということである。ネットワークに複数の装置が同時に信号を出そうとすると、待ち合わせが起こるので、ネットワークの混雑度がある程度以上になると急激にパフォーマンスが低下する。高速道路も車が増えると渋滞するのと似ている。

ついでに伝送距離のことも言っておくと、100Mbps のイーサネット規格である 100BASE-TX の場合、信号を伝えることのできる最大の距離(最大伝送距離)は100m である。つまり、ケーブルの長さは 100m まででなければならない。その以上の長さを伝送したければ、途中で信号を中継できる装置を使うか、別の方式で接続する。よく見かける「スイッチングハブ」 (あるいは「スイッチ」とも呼ぶ)という装置は、ネットワークを分岐させるのに使われているが、中継も行っているので、スイッチングハブを通せば100m以上でも伝送できる。

キャッシュメモリ

主記憶に使われる DRAM は CPU の速度に比べてずっと遅いということは前に説明した。例えば、CPU のクロックが 500MHz だとすると、あるクロックパルスと次のクロックパルスの間の時間間隔(これをクロック周期とかサイクルという)は、1/(500*1000000) 秒 = 2 × 10^(-9) 秒 = 2 ns (ナノ秒) であるが、DRAM への一回のアクセスにかかる時間は 60ns 程度のものである。 (最近はもっと速い。60ns というのは、CPU が 500MHz くらいだったころの話。) (DRAM に対して、例えば読み出しの指示をする信号を送っても、データが DRAM から実際に出力されてくるのは 60 ns後。)

1ms (ミリ秒) = 1 × 10^(-3) 秒 = 1/1000 (千分の1)秒
1μs (マイクロ秒) = 1 × 10^(-6) 秒 = 1/1000000 (百万分の1)秒
1ns (ナノ秒) = 1 × 10^(-9) 秒 = 1/1000000000 (10億分の1)秒
1ps (ピコ秒) = 1 × 10^(-12) 秒 = 1/1000000000000 (1兆分の1)秒

これでは、いくら CPU が速くなっても、CPU がメモリアクセスをするたびに待ちが発生する(メモリから反応が返るまで CPU が待つ)ので、コンピュータ全体の性能は上がらない。

もちろん、DRAM を全部 SRAM のような速いメモリに置き換えれば速度は格段に向上するが、SRAM は高価なため、コストがかかってしまう。

そこで、少量の高速メモリを使うだけで、大量の高速メモリを使うのとそう変わらないような効果を上げられるような方法が考案された。その技法をキャッシュメモリという。キャッシュメモリを使った場合、全てのプログラムの動作が高速化されるわけではないが、統計的にみて多数のプログラムが高速化される。キャッシュメモリのために使われる高速メモリとしては普通 SRAM が使われる。

キャッシュメモリの原理 I (読み出し)

まず、簡単のため、メモリの読み出しについてだけ考える。(書き込みについてはあとで。) CPU は、主記憶から直接にデータを読み出すのではなく、主記憶の一部の内容のコピーがキャッシュメモリ内に作られ、CPU はそこからデータを読み出す。もう少し詳しく言うと、主記憶の X 番地の内容を読まなければならないとき、

もし、X 番地の内容のコピーがキャッシュメモリにあることがわかっていれば、CPU はキャッシュメモリからそれを読み出す。主記憶ではなく、高速なキャッシュメモリにアクセスするので、この読み出しは高速にできる。
もし、X 番地の内容がキャッシュメモリにないときは、X 番地を含むある大きさ(例えば 128バイト)の連続したメモリ領域がキャッシュメモリにコピーされ、CPU はそこから X 番地のデータを読む。この、一回に転送される連続したメモリ領域のことを「キャッシュライン」あるいは「ライン」と呼んでいる。

                                 X 番地(＊の所)
  主記憶                           ↓
    ┌───────────┬────────┬──────────┐
    │         …           │/////＊/////////│         …         │
    └───────────┴────────┴──────────┘
                                     │
                     ┌───────┘ライン(斜線部)をコピーする
  キャッシュメモリ   ↓
    ┌───┬────────┬──────┐
    │  …  │/////＊/////////│     …     │
    └───┴────────┴──────┘
                   │ 
                   │読み出し
                   ↓
               ┌───┐
               │ CPU  │
               └───┘

このようにして、ある記憶領域をキャッシュメモリの一部に対応づけることを、「(その領域を)キャッシュ(cache)する」と言う。

RAM はランダムにアクセス可能であるが、実際のプログラムの挙動を見ると、本当にランダム(でたらめ)な順序でメモリをアクセスするわけではなく、ある番地にアクセスしたら、近いうちにまたその近くの番地にアクセスすることが多い。従って、X 番地を読む時に、X 番地だけでなく、その回りの番地も合わせた1つのラインをキャッシュにコピーしておけば、それからしばらくの間のアクセスは主記憶に対してではなく、キャッシュに対するアクセスで済ませられる割合が高いと予想され、速度の向上が期待できる。

つまり、キャッシュメモリによって高速化が達成できるのは、メモリアクセスのパターンが次のような空間的局所性と時間的局所性を持つ傾向にあるからだと言える:

空間的局所性: ある一定時間内にアクセスされるデータは、比較的近いアドレスに分布する。
時間的局所性: ある一定(の範囲)のアドレスのデータに対するアクセスは、比較的近い時間内に再発する。

アクセスしようとしているメモリアドレスがキャッシュメモリ上にあった場合、「キャッシュにヒットした」という。逆にキャッシュメモリ上になかった場合は「キャッシュミスが起きた」という。

アドレスの対応づけ(写像)

主記憶上でのラインの配置とキャッシュメモリ上でのラインの配置には何の関連もない。例えば、下図のようになっていてもよい。

                                 
  主記憶       ライン1             ライン2
    ┌───┬─────┬───┬─────┬──────────┐
    │  …  │//////////│      │//////////│         …         │
    └───┴─────┴───┴─────┴──────────┘
                 │                  │
                 └───────┐  │
                     ┌─────┼─┘
  キャッシュメモリ   ↓          ↓
    ┌──┬─────┬──┬─────┬────┐
    │ … │//////////│    │//////////│  …    │
    └──┴─────┴──┴─────┴────┘
             ライン2           ライン1
             のコピー          のコピー

そこで、現在主記憶のどのラインがキャッシュメモリのどの場所にキャッシュされているかを極めて短時間で調べる方法が用意されている。(その方式については省略。)

ラインサイズ

ラインのサイズを大きくすると、実際にはアクセスしないデータまでたくさん移動させることになるから、ラインサイズはあまり大きくできない。逆に、ラインサイズがあまり小さいとキャッシュの意義が薄れてしまう。実際には、もっと色々な要因も考慮に入れてラインサイズを決めているが、専門書によれば、32バイトから256バイトの間に設定されるのが普通だという。

ラインの置換

ところで、主記憶よりもキャッシュメモリのほうがずっと容量が小さいのだから、あるラインをキャッシュメモリに入れるためには、別のラインをキャッシュメモリから追い出さなければならなくなる、ということが頻繁に起きる。この時、できるだけ「最後にアクセスしてから一番長く時間がたっているラインを追い出す」というアルゴリズム(LRU アルゴリズム ← Least Recently Used )(に近いアルゴリズム)を使うようにしている。(「できるだけ」とか「近い」と書いたのは、完全な LRU アルゴリズムを実現するのは手間がかかるから。複雑なアルゴリズムを使ったために処理速度が落ちては意味がない。)

何故そのようにするか、という理由だが、それはもちろん、先程説明した時間的局所性と空間的局所性のためである。つまり、最近アクセスしたばかりのラインには、近々再びアクセスする可能性が高いので、できるだけ追い出したくないのである。

多段キャッシュ

キャッシュメモリと主記憶との間にもう一段キャッシュメモリを置くことも多い。この場合、CPU に近いほうのキャッシュメモリを1次キャッシュ、遠いほうを2次キャッシュと呼ぶ。こちらをそれぞれ、レベル1(L1)キャッシュ、レベル2(L2)キャッシュと呼ぶこともある。2次キャッシュと主記憶の間にもう一段キャッシュを置くこともある(3次キャッシュ, レベル3(L3)キャッシュ)。

多段キャッシュを使う理由だが、キャッシュと主記憶の速度に差がある場合、その差を吸収する必要があるからである。

キャッシュのサイズ(=バイト数)については、(普通) 1次キャッシュのサイズ < 2次キャッシュのサイズ < 3次キャッシュのサイズ < 主記憶のサイズとなるようにする。(最近の設計で、1次キャッシュと2次キャッシュのサイズが同じということもある。)

最近のMPUでは、1次キャッシュがCPUといっしょにLSIに入っていることが多い。2次キャッシュもいっしょに入っている場合もある。

分離キャッシュと統合キャッシュ

命令アクセス用のキャッシュとデータアクセス用のキャッシュを別にすることも多い。別にしたものを分離キャッシュ、分離しないものを統合キャッシュと呼ぶ。分離する理由は、命令アクセスとデータアクセスでは、メモリへのアクセスの仕方がかなり異なるからである。命令アクセスでは、連続した番地へのアクセスを行なう確率が非常に高いのである。また、命令は(原則的に)読み取りしかしない。そのため、命令用のキャッシュは単純化する事が可能。 1次キャッシュは分離キャッシュで2次以降のキャッシュは統合キャッシュ、という例も多い。

キャッシュメモリの原理 II (書き込み)

ここまでは読み出しアクセスだけを考えていたが、書き込みの際は難しい問題が起きる。主記憶にアクセスすると遅くなるので、できるだけ主記憶への書き込みは減らしたいのだが、キャッシュにだけ書き込みをして、主記憶への書き込みをしないと、キャッシュの内容と主記憶の内容が食い違ってしまう。

  主記憶
    ┌───────────┬────────┬──────────┐
    │         …           │/////＊/////////│         …         │
    └───────────┴────────┴──────────┘
                                   ↑
                   ┌───────┘食い違い
  キャッシュメモリ ↓
    ┌───┬────────┬──────┐
    │  …  │/////＃/////////│     …     │
    └───┴────────┴──────┘
                   ↑ 
                   │書き込み
                   │
               ┌───┐
               │ CPU  │
               └───┘

従って、この食い違いがのちの処理に影響を及ぼさないように、適当なタイミングでキャッシュの内容を主記憶に書き込まないといけない。その方式には次の2つがある:

ストアスルー方式: キャッシュに書込みがあった時、常に主記憶にもその内容を書き込む。ライトスルー方式とも言う。
ストアイン方式: 更新された(つまり、書込みが一度でも行なわれた)ラインがキャッシュから追い出される時に、その内容を主記憶に書き込む。ライトバック方式とも言う。

ストアスルー方式では、書き込みがあるたびに、主記憶へのアクセスが起き、主記憶の遅さのために長い待ち合わせが起きるから、メモリアクセスの速度が低下する。しかし、方式が単純なために実現しやすいというメリットがある。ストアイン方式だと、主記憶への書き込みの回数をストアスルー方式よりも減らせるため、メモリアクセスの速度低下を防ぐ効果が大きい。ただし、処理が複雑になるため、実現は多少面倒になる(回路が複雑になる)。

以上のような複雑な制御を高速で行なうために、キャッシュメモリにはキャッシュコントローラと呼ばれる制御回路がついている。(ただし、マシンによっては、キャッシュメモリの制御の一部をソフトウェアで行なっているものもある。)

最近の Pentium II, III, 4 とか PowerPC G3, G4, G5 が速いのは、高速キャッシュ技術によるところが非常に大きい。

ディスクキャッシュ(バッファキャッシュ)

キャッシュメモリの考え方は、他の所にも色々と応用がきく。だいたい、動作速度に大きな違いのある2つの装置がデータをやりとりしなければならないような状況では、キャッシュメモリと同様の考え方が使えることが多い。

主記憶とハードディスクでは、速度が大きく異なる。そこで、できるだけハードディスクへのアクセスを減らすことを考える。といっても、主記憶とハードディスクの間に(キャッシュメモリのように)別のハードウェアを追加するわけではない。主記憶の一部にハードディスクの内容をキャッシュするようにするのである。これをディスクキャッシュと呼ぶ。制御はソフトウェアで行なう(オペレーティングシステム(OS)の仕事)。ハードディスクはあちこちを飛び飛びにアクセスするよりも、連続した部分を続けてアクセスする時のほうがはるかに高速にデータを転送できるから、あるデータを読む時に、その前後のデータもついでに読み込んでおくのは高速化に極わて有効である。(飛び飛びにアクセスすると、シーク時間や回転待ち時間がかかるために速度はガタ落ちになる。)

ただし、これには短所もある。書き込みの際、ディスクキャッシュに書き込まれたデータはすぐにはハードディスクに書き込まれない。もしもディスクキャッシュとハードディスクの内容に食い違いがある状態でコンピュータがハングアップしたり、電源が落ちたりすると、ハードディスクの内容は正しくない状態のままになってしまう。(ディスクキャッシュの制御は OS がやっているから、 OS がハングアップするとお手上げである。また、電源が落ちると、主記憶の内容は消えるから、ディスクキャッシュの内容も消えてしまう。) こうした場合の被害を少なくするためには、一定の時間ごとにディスクキャッシュの内容をハードディスクに書き込むようにするとよい。UNIX の場合、ハードディスク上のファイルの内容だけでなく、ファイルを管理するための情報も部分的に主記憶に移してアクセスしている(もちろん高速化のため)。UNIX の場合、電源を切る前に必ずシャットダウンという手続きを取る(シャットダウンプロシージャと呼ばれるプログラムを走らせる)。この手続きによって、全てのプログラムが停止させられると共に、メモリ上にキャッシュされていたデータがハードディスクに書き込まれる。(これでどうしてコンピュータの電源スイッチをいきなり切ってはいけないかわかりましたね?) なぜ、全てのプログラムを停止させるのを先にやるかと言うと、何かプログラムが動いていたとすると、そのプログラムがデータの変更を行なうかも知れないからである。全てのプログラムを止め、これ以上絶対にデータの変更が起きないようにしておいてから、全データをハードディスクに書き込むわけである。

昔のパソコンの OS には、ハードディスクやフロッピーディスクへの書き込みを毎回正直にやっているものがあった。おかげでディスクにアクセスを始めたとたんにマシンが遅くなって困ったものであったが、ディスクに書き込みをしていない時なら、いきなり電源を切っても大抵何ともなかった。現在の Windows や MacOS では、電源を切る前にシャットダウンの手続きが必要である。その代わりにディスク回りが高速化されたのは結構だといえるが、OS が不安定でよくハングアップするので、ディスクの内容がよくおかしくなるのは困ったことである。その点 Linux は極めて安定しているので安心して使える。

Linux の OS 自体はほとんどハングアップしないが、ユーザインタフェースに時々バグがあって、ユーザインタフェースがハングアップしてしまうことがある。この場合でも OS は動いているので、ユーザインタフェースだけ再起動すれば、再び使い続けることができる。

補足: 「一定の時間ごとにディスクキャッシュの内容をハードディスクに書き込むようにするとよい」と書いたが、UNIX の場合は、sync というコマンドを実行すると、メモリ上におかれたディスクの情報がディスクに反映される。この sync コマンドを、UNIX は、標準で 30秒に一回実行している。シャットダウンの際にも sync が行なわれる。 (sync という名前は synchronize (同期させる)という言葉から来ている。)

マウント(mount)とアンマウント

オペレーティングシステム(←普通 OS と略す) はディスク(やその他の補助記憶)への書き込みを即座には行なわないので、いきなり電源を切ると困ったことになる、という説明をした。それと同様の問題が、フロッピーディスクやUSBメモリなどの取りはずし可能な記憶媒体を抜く時にも起こる。

いわゆる PC 互換機にはフロッピーのイジェクト(eject, 排出)ボタン、あるいはイジェクト・レバーがついているので、次のような失敗をする可能性がある:

        文書等のファイルをフロッピーに保存する操作をする →
        しかし、OS はすぐにはフロッピーへの書き込みをしない →
        ユーザはそれと知らずにフロッピーを取り出す →
        ユーザは電源を切ってしまう(シャットダウンする) →
        メモリ上にだけ存在していたファイルは読めなくなる!!

こうなるかどうかは OS によって違う。Windows の場合は、フロッピーについては、書き込みを毎回正直にやることによって、メモリ上の内容とフロッピーの内容が極力ずれないようにしているようである。Linux の場合には、普通フロッピーに対してもキャッシュをして、処理を高速化しているので、実際上のような問題が起こり得る。

フロッピー等を取り出す前には、「アンマウント」という操作をしなければならない。(ただし、OS によっては、「アンマウント」という名前がついていないこともある。)アンマウントの際に、書き込みが未完だったデータはすべて書き込まれる。

近頃の Macintosh にはフロッピーディスクドライブ(FDD)がないが、むかし FDD がついていたころ、イジェクトボタンがなかった。フロッピーのアイコンをゴミ箱アイコンまでドラッグすると、アンマウントが行なわれ、自動的にフロッピーが排出される、という安全設計になっていた。

ワークステーションの FDD にもイジェクトボタンは無いことが多い。あったとしても、普段はボタンがロックされており、アンマウントの操作をして、イジェクトのためのコマンドを実行しなければイジェクトボタンが動作しないのが当たり前。(しかし、近頃はコストを下げるために、ワークステーションでも PC 用のフロッピーディスクドライブを使っている例がある。) データの書き込み中にイジェクトボタンに何かが当たってしまう事も考えられる。イジェクトボタンでフロッピーをいつでも取り出せてしまう PC 互換機の設計はひどい欠陥だと言われてもしかたがなかろう。

USB メモリの場合は、引っ張るだけではずせてしまうので、ユーザが自分で気をつけないといけない。

ところで、アンマウントは、書き込みを完了させるためだけにするのではない。ハードディスクや、MO、フロッピー、CD-ROM などにはファイルが格納されているが、OS はそれらへのアクセスを管理している。いきなり記憶媒体をはずされたりすると、管理上困ったことが起きる。例えば、CD-ROM 上のファイルを読み込んでいる途中のプログラムがあったとすると、いきなり CD-ROM が抜かれれば、困ったことになるのは想像がつくだろう。だから、 CD-ROM のように書き込みのできない媒体の場合でも、抜く前にはアンマウントが必要である。アンマウント操作をすると、その媒体のファイルを使用しているプログラムがないかどうかチェックが行なわれる。もしあれば、アンマウントは行なわれない。ない場合は、未完了の書き込みがあれば完了させ、ファイルシステムの管理情報を更新するなどの処理(まあ、後かたづけみたいなもの)を行なう。

ハードディスクは普通媒体を抜くことができないが、それでもアンマウントをする場合はある。コンピュータ管理の都合上、特定のハードディスク(あるいはハードディスクの特定の区画)だけ使用しない状態にしたい、といった時などにアンマウントをする。

アンマウントとは反対に、補助記憶装置を使いはじめる時にも手続きがいる。それにはマウントという操作をする。オペレーティングシステムは、マウント操作によって、ファイルシステム管理情報を適切に更新したり、その装置を使いはじめるための初期設定のようなことを行なう。

昔の Mac の場合は、フロッピーを挿入しただけで自動的にマウント処理が行なわれ、画面にフロッピーのアイコンが現れるようになっていた。(だから、ユーザがマウント・アンマウント処理を意識することはほとんどない。) PC 互換機ではこれは不可能。なぜなら、フロッピーの抜き挿しがあったことをFDDから CPU に伝える方法が存在しないから。ハードウェアの問題なのでどうしようもない。