Pentium以降のCPUで導入された仮想86モード拡張(仮想8086モード拡張)について考えてみます。 仮想86モード(仮想8086モード)そのものは386で導入されたものですが、 この機能拡張によりマルチタスクOS環境下でのMS-DOSプログラムの実行速度が向上します。 (ロングモードには仮想86モードがありませんので、当ページの記述は32ビット環境限定です。)
仮想86モードとは、32ビットプロテクトモード下で動作するタスクの一形態です。 主として8086用(16ビット・リアルモード用)に作られたプログラム(MS-DOSプログラムなど)を 32ビット・マルチタスクOSの環境下で動作させることを目的としています。
一番の特徴は、アドレス(リニアアドレス)がリアルモードと同じように生成されることです。 16ビットもしくは32ビット・プロテクトモードのプログラムであれば、 セグメントレジスタに入っている値はセレクタとして用いられ、そのセレクタが指すセグメント・ディスクリプタに記述された ベースアドレスはオフセットアドレス(命令のインストラクション・ポインタやオペランドアドレスなど。正確には実効アドレスと呼ぶ)と加算されて リニアアドレスとして用いられます。 一方仮想86モードになると、セグメントレジスタに入っている値はセレクタとして用いられるのではなく、 その値が直接リニアアドレスの生成に用いられます。すなわち8086と同じように、 セグメントレジスタに入っている値が16倍されたもの(セグメントアドレス)に、オフセットアドレスが加算されて リニアアドレスとして用いられます。
仮想86モードはプロテクトモード下で動作しますので、生成されたリニアアドレスは (ページングが有効であれば)ページングの対象となります。
仮想86モードはCPL=3で動作し、特権命令など実行できない命令があります。 特に重要なのは、リアルモードでは問題にならないものの 仮想86モードでは問題になる命令があることです。
これらの命令が特別な扱いになっているのは、 アプリケーションプログラムから勝手に実行されると OSの信頼性、OSとの整合性を損なう恐れがあるためです。
(1)については、TSS中のI/O許可ビットマップでコントロールします。 クリア(=0)されていればI/Oポートへのアクセスが許可され、セット(=1)されていると I/Oポートへアクセスしようとすると一般保護例外が発生します。 (2)が本ページのメインテーマになります。
仮想86モードでの割り込みフラグ操作はIOPL(I/O特権レベル)によって動作が異なります。 なおIOPLによって動作が異なる命令をIOPLセンシティブな命令と呼びます。 仮想86モードで動作しているプログラムがCLI/STIを実行すると 以下のようになります。
IOPL=0の場合はCLI/STIを実行すると一般保護例外になりますので OSは例外ハンドラの中で割り込みフラグのエミュレートを行います。 本物の割り込みフラグ(IF)が変更されることはありません。 おおよそこんな感じになります。
外部割込み発生時の対応は以下のようになります。 上記の「仮想割り込みフラグ」の状態によって 処理が変わってくる点に注意してください。
OSが割り込みフラグの操作をエミュレートすることで、 OSの信頼性、OSとの整合性を損なう恐れはなくなりますが、 その代償として、CLI/STI命令の実行がかなり遅くなってしまいます。 命令を実行する毎に一般保護例外になって例外ハンドラに制御がうつるためです。 CLI/STIを多用するMS-DOSプログラムで特に問題になります。
仮想86モード拡張では、上記割り込みフラグのエミュレートの一部を CPU側で代行します。 これにより、割り込みフラグを操作する命令の実行が高速になります。
IOPL=3の場合は標準の仮想86モードと変わりありません、 IOPL=0の場合の動作が異なっています。 仮想86モード拡張では、EFLAGSレジスタ中の2つのビットが有効になります。 VIF(Virtual Interrupt Flag, bit19)と VIP(Virtual Interrupt Pending, bit20)です。 CLI/STIを実行するとIFではなくVIFを操作することになります。 VIPは保留中の外部割込みがあるかどうかを示すフラグで OSがセット/クリアします。 これら2つのフラグによって、 割り込みフラグのエミュレートのほとんどが CPUによって直接行われることになります。
VIP=1は保留中の外部割込みがあることを示し、 VIP=1の時にSTIを実行すると一般保護例外になるので OSは例外ハンドラの中で保留中の外部割込みの処理を開始させます。
仮想86モード拡張を使うと、標準の仮想86モードと比べてどの程度速くなるのでしょうか? 簡単なプログラムでテストしてみました。 テストに用いたプログラムです。
CLI/STIを1億回実行し、所要時間を調べます。 CLI/STIはインラインアセンブラで記述しています。 上記プログラムをLSI C-86でコンパイルし、さまざまなOSで実行してみました。
時間の計測精度が1秒単位ですので、1秒未満の値にはあまり意味がありません。 (3)と(4)(5)を比べると、仮想86モード拡張の効果が大きいことがわかります。 さらに(1)と(4)(5)を比べると、仮想86モード拡張では リアルモード並みの速度が期待できることもわかります。 実際のアプリケーションプログラムでは 外部割り込みも多数発生するでしょうし、 CLI/STIばかり実行しているわけではないので こんなに速くなることはないでしょうが、 それでも仮想86モード拡張の効果は抜群です。
(4)(5)のVME=1(仮想86モード拡張が有効)であることは KD(カーネルデバッガ)を用いて 以下のようにすることで確認できます。 なお(3)についてはなぜかカーネルデバッガが使えなかったので 確認していません。すなわちNT3.51のVME=0は推測です。(NT3.51の登場時期を考慮するとVME=0(ターゲットとするCPUは386/486)と考えるのが妥当)
CR4レジスタの最下位ビット(bit0)がVMEビット(Virtual-8086 Mode Extensions, 仮想86モード拡張をEnable/Disableするためのビット)ですので、 WindowsNT4.0もWindows2000も仮想86モード拡張を使っていることがわかります。 (Win2KはともかくNT4.0が仮想86モード拡張を使っていることは今回初めて知った。) なおCR4レジスタはPentiumで追加された制御レジスタです。
番外編として、上記と同様のプログラムをポケコンでも走らせてみることにしました。 用いたのはCASIO製FX-890Pです。 このマシンはポケコンながら8086互換の16ビットCPUである 80L188EB(組み込み用途向けCPU)を搭載しています。 クロック周波数は仕様表に載っていませんが、インテルのカタログを見ると 3V動作品は13MHz, 16MHz, 5V動作品は13MHz, 20MHz, 25MHzがラインナップされているので、 おそらく13MHz, 16MHzのいずれかと思われます。(もしかしたら、さらに低クロックで動作させているのかもしれません。)
「ポケコンなんてまだ売られているの?」とお考えになるかもしれません。 購入したのは2004年の春頃ですが、しっかり売られていました。 店員に質問すると「工業高校などで需要があるので、メーカーはまだ生産を続けている」のだそうです。 カシオだけでなく、シャープも同様だそうです。(購入店は秋葉原ラジオセンター内にある「つかさ無線」です。) 価格は2〜3万円弱で、最近のこの手の製品にしては珍しく「MADE IN JAPAN」でした。
このFX-890Pの良いところは、8086互換のCPUを搭載していることです。 ポケコンというとZ80互換のCPUを搭載している場合が多いですが、 こちらは8086互換なので、パソコン感覚でプログラミングできます。 さらに良いのは、アセンブラ、BASIC、Cが使えることです。(CASLも使えます。) 小さなプログラムを作って遊ぶにはうってつけです。
まずメインメニューを出します。(電源ON -> 「MENU」キー)
次にアセンブリ言語メニューを出します。(「5」を押して「5:ASMBL」を開く)
「S」キーを押してエディタ画面に入ります。そして下記プログラムを打ち込みます。
CLI/STIを1億回実行して戻るだけのプログラムです。 プログラムの最後がRETではなくIRETになっていますが、 これはBASICやCからサブルーチン・コールした場合の戻り方がこうなっていることによります。
入力し終えたら、「SUB MENU」(「SHIFT」+「MENU」)を押して「アセンブリ言語メニュー」に戻り、「A」キーを押してアセンブルを開始します。 「Assemble Start!」と表示された後、以下のような画面になるはずです。
次にBASIC言語メニューを出します。(「MENU」キー -> 「2」を押して「2:BASIC」を開く)
上記画面から直接下記プログラムを入力します。 (C言語でなくBASIC言語を使うのは、時間計測の関数がC言語には用意されていないからです。)
行番号20において、タイマー変数(システム変数)を初期化します。 1/10秒毎にカウントアップする16ビット長の変数です。 行番号40において、さきほど入力したアセンブリ言語のルーチンを呼び出します。 ちなみにFX-890Pでは、セグメントベース(CSレジスタの値)はデフォルトでゼロになっていますので、 リニアアドレスは02000Hになります。
入力し終えたら、さっそく実行しましょう。 BASICのRUNコマンドを実行します。
734秒、MMX Pentium(300MHz)のおよそ100倍の所要時間になりました。 意外に速いと感じられるのではないでしょうか?
最終更新日:2005年1月24日(月)