March 31
F通の鬼っ子マシンMV205のナゾ(今時ATマザーボード採用編)
March 28
デリバティブ取引のナゾ
March 25
CPUメモリー転送能力のナゾ最終編(Pentium-2,P55C,
K6,CyrixMMXを同クロックで比べる編)
March 20
PPP接続をロハで高速化する方法のナゾその2(山本式ブロックモード設定であと15%稼ぐ編)
March 14
PPP接続をロハで高速化する方法のナゾ(tcp/ipとEthernetの本質に迫る編)
March 9
ダメなマウスのナゾ(ネット史上初、山本式マウス改造法リアルビデオ編)
March 7
山本式バーチャルサウンドシステム(PAT
PEND.)のナゾ
March 5
平成10年型石油ファンヒーターのナゾ(季節遅れのネタ編)
March 3
L2キャッシュ有効でベンチマークが遅くなるCPUのナゾ(6x86MXとP55Cの違いを探る編)
March 1
山本式スーパースロットスタビライザーのナゾ(風水学的ノイズ及び電圧降下根絶編)
最近F通からMV205なる変なマシンが出たので調達した(写真はF通のリンク)。まず格好がヘンだ。今時安物はデスクトップ、高級品はミドルタワーが主流だが、これは安物なのにマイクロタワーだ。前面パネル下方とケース側面に通風口があるので通風は良い。マザーはケースと別体の板に固定されている。
マイクロタワーと称しているが、実際にはATミニタワーに相当する。ドライブベイは5inchx2、3.5inchx3で、うち3つが顔を出し3.5inchx2が空いている。このケースはACERのOEMをF通が改悪している。ACER純正ケースでは3.5inchが2個パネルに顔を出しているのに、F通は1個のみ。板金部分は2つ分空いているのにである。おそらくラインアップの整合性を取るためだろうが、まったく余計な事をしてくれるもんだ。以前、
ベアキットを使ったP55C変造マシンのナゾ(調達条件に制限のある場合編)
に書いたように、webmasterはATXマザーを好まない。ATXマザーでは妙に横長の大型になるのでデスクトップケースという形態が成立しない。
ATXマザーをタワーに入れると、背が無用に高くなるのでミニタワーという形態が成立しない。背を低くするために電源を横にシフトさせると、幅が広くなる。さらにマザーと電源に追い出されたドライブベイが前面パネル下方に来ると、前後長まで長くなる。つまり、ATX、特にPen-2用はスペース効率が最悪になる。
ATXマザーでは、CPUが通風の良い前面パネル付近ではなく、灼熱地獄の電源近くに位置するため、パソコン風水学的にも良くない。もちろん、ATマザーではフルサイズカードがCPUの放熱器に当たる欠点があるが、マザーボードを左図のように前後に長くするか、あるいは右図のように、CPUをスロットからズラせばすむことである。ATXはPen-2を成立させるためのインテルの策謀(大笑)ではなかろうか?
脱線した。MV205はK6採用という点でも変わっている。マザーはACERのV-58のOEMで、チップセットはAladin-IV+(ALI1531/ALI1543)と、AGPが無い以外は新しい。クロックは83MHzまでで、PCIクロックは仮想同期(60と75MHzは30MHz、66と83MHzは33MHzになるという情報あり)。設定はマザーに印刷されているし、詳細なマニュアル(PDF)は、ALIのWebで入手できる。
WebmasterはALIのチップセットは好きでない。拡張や設定に何かと制約が付くことが多く、これがFM/Vユーザーの迷惑のタネになって来た。最近F通がALIでなくINTELのチップセットを使っているのは懲りたからと思っていた。このマザーもパラレルポートやIDEあたりに制約の気配があり、BIOS設定も自由度が低い。
マザーはベビーATで、PCIx3,PCI/ISA兼用x1,ISAx2である。カタログではISAx1とあるが、これはUSBコネクターパネルがスロットの後面を塞いでいるためだ。このパネルを上方に引っ越すと、全スロットが使える。F通のボーンヘッドと思うが、あるいは製品ライン上で拡張性が突出しないためにワザとしているのかも。ビデオ、サウンド、モデムを3枚差した現状でPCIが3本空いている。
このマザーは、評判悪いACERのOEMにしては汎用品に近いデザインなのが救われる。汎用品と異なるのがAT仕様の電源コネクター付近の電源制御コネクターと、モデム着信でスタンバイ解除する配線コネクターだ。電源スイッチはソフトウェア制御だが、なぜかリセットスイッチもある。
サウンドボードはCrystalSound(ACER製AF-35F)で、DOS上はSB-pro互換、Win95では16bit可で、SRS-3Dサウンド対応だ。ウェーブテーブルは無くソフトMIDI(VSC-88)が付いてくる。コストダウンのためか、SB-16のはるかに下を行く相当ひどい音で、出力はヘッドホン用。オマケのスピーカー(外付け電源あり)もかなりの安物である。
カードモデム(ISA)はF通製で、着信検知の配線がマザーへ、ボイスの配線がサウンドカードへ行っている。33.2kbpsだが、56kbpsのサポート検討中とか。これを抜いて、BIOS設定でCOM2を設定し、デバイスドライバーを削除して、メルコのISA規格Ethernetカードを差したが問題無い。
ビデオカードは、ATIの3DRAGE-II相当品。2Dは良好で、3DではVirgeDXよりやや早く、Permedia2に遠く及ばない。画質はまずまずで、ハイエンドゲーム以外は問題無かろう。モニターはオマケにしては良質で、NEC並みの品質に近づいてきた。
K6-200ALR(9805BJBW)はcore2.9V、I/O3.3V、バス66MHzの3倍で、レスポンスはP55C(233MHz)相当。core3.2Vだと、233MHz以上(あやしい表現)でも動作したが、かなり発熱するのでWebmasterのポリシーとあわない。マザーのcore電圧設定は2.1、2.8、2.9、3.2、3.3、3.5が可能だが、2.9Vと3.2Vの間が無い。そこでバス75MHzの3倍(225MHz)にすると、Core2.9Vでも安定し。66MHzの3.5倍より早い上に発熱も少ない。CPUの個体差もあるが、これでP55C-233MHzとPen-2-266MHzの中間をねらうのがベストであろう。ハードディスクはF通製?2.1GBと小さめだが、アクセスは静かでかなり早い。CD-ROMドライブも上質である。
このマシンはF通の製品ラインアップと異なり、オマケソフトが少ない。一太郎オフィス、123とオーガナイザー、IE4、Netscape4.03以外にはめぼしいモノが無いが、おかげでジャマ物を消す手間が省ける。IE4やプロバイダー接続ソフト等のジャンクを整理すると半分以上空いたので、当分は問題にならないだろう。
このMV205は、ケースやCPU、オマケソフト等の点で、F通のラインアップから大きくはずれている。F通がこれを出した理由は、現状のデスクトップ型の将来に不安があるからだろう。デスクトップのマザーは特殊で交換しにくい上に、拡張性が低く人気が低下傾向である。一方ATXのタワーはサイズがデカすぎ、狭い日本ではジャマだし液晶モニターともバランスが悪い。かといってP55Cの233MHzではPen-2と差別化出来ないし、インテルのチップセットではバスクロックが上げれない。
その妥協点がATミニタワーにK6(200MHz)とALIのチップセットなのだろう。マザーはいろいろ設定が可能でマニュアルも入手可で安価なうえにマザーもAT規格と、F通にしてはめずらしくおもしろいモデルだ。しかしこのモデルが既存のラインアップを壊すと困るので仕様やオマケをわざとスペックダウンして安価に設定したのだろう。
これでコンパックあたりの$1000パソコンにも対抗できる。おまけけに前面3.5inchベイも塞いでくれてMOやPCMCIAソケットを使いにくくしているので、上級モデルの商売のジャマにもならない。一方、オフィス系統ソフトはフル装備で、よけいなオマケが無いのでコンフリクトの可能性が低い。クライアント用よりは、むしろスペックを追わない枯れたユーザーに向いている。
本日の新聞によると、某飲料メーカーがデリバティブで1000億円以上の損失を被っていたことが発覚したらしい。デリバティブとは何だろうか?新聞には、金融派生商品の事で、為替、金利などの変動リスクを回避するための先物、オプションやスワップなど、とあるが、何のことかサッパリわからない。
証券と違って、やったことが無いので本を漁るしか無いが、ショッキングな事が書いてある。いわく、35才以上の人間には絶対に理解できない、とある。以前はパソコンなどでも言われたセリフである。また報道でも、多くの破綻した企業の解説でよく出てくるのが、M資金とデリバティブである。
いわく、損失を埋めようとして頻繁のデリバティブ取引に手を出したために、損失が雪だるまのようになって破綻した云々。何か、やばそうな感じがするがどうだろう。
まずスワップであるが、固定金利と変動金利のスワップが代表的なモノらしい。たとえばA社は固定金利でカネを借りていて、B社は変動金利でカネを借りている。通常は固定金利の借金と、変動金利の借金は交換するには、いったん全額返済して借り換える事になる。
たとえば公庫の住宅ローンは固定金利なので、金利が高い時に借りた固定金利を引きずると低金利下では損をする。また逆に、この先金利が上昇するという読みがあれば、変動金利を今のうちに固定金利に変えたいと思うであろう。
住宅ローンなら、銀行から新たに変動金利でカネを借りて固定金利のローンを一括返済すれば、変動金利に変えたことになる。また、逆も可能である。このしくみは明快であるが、元本も移動するから、登記簿上の抵当権は公庫から銀行に移るし、書類の手続きも煩雑である。会社なら資産や負債の数字が変動する。
もし元本でなく、固定金利と変動金利のみを交換する仕組みがあれば、同じ事をやっても資産や負債に変化として現れず金利を流動化することができる。
例えば、この金利なら固定金利を払いたい、または、この金利なら固定金利を貰いたい、というのが取引の対象になる。これで、先々の金利変動をヘッジすることができる。取引はあくまでも元本でなく、金利のみに関する取引であるところが、派生商品と呼ばれる由縁らしい。
しかし固定金利の場合は、当初金利、期限、支払日が個々に異なる上に、現在の金利(LIBOR)も刻々変化するので、金利を交換する取引は計算が難しい。おまけに、そもそも金利が意味を持つのは先々のハナシなので、金利動向の読みが当たるかどうかによって損得が発生するところが、先物と同じようにリスキーである。
さらに、実際には帳面上は金利だけの取引ではあるが、元本(みなし元本)も動かしたのと同じような経済効果が起こり得るのに、それがいろいろな経済指標にあらわれないところが怖いところである。
スワップには、他にも円金利とドル金利などのように、異種の金利に関してもスワップが成立する。これにより為替変動に対してもヘッジする事ができる。同じように、原理的には、ありとあらゆる種類の金融に関する金利や指数、指標などがスワップの対象になり得る訳である。
というわけで、デリバティブ自体は悪いハナシでは無い。変動をヘッジし、またいろいろなモノを流動化する技術と考えられる。ただ、読みと計算が複雑になるので、高度の運用技術が求められる。デリバティブを一方的にあやしいシロモノと紙面で決めつけている間は、とても外資には太刀打ちできない。
欧米人のエライところは、どんなモノでも取引の対象とし、その価値を評価し、それを取引する技術を作りあげる所だと思う。一方、日本の弱いところは、ソンしたモノをため込んでも、その価値を評価し、取引して流動化する技術が乏しい所だと思う。とにかく、何でもため込み先送りして、それが最後にはじけるわけだ。
しかしよく考えると、日本では株券そのものが究極の派生商品かもしれない。財務諸表は粉飾の固まりだし、取引市場は規制や操作下にあり、情報はインサイダーばかりであり、株主は経営に対する影響力が無いから、株そのものが元本や不良債権にまったく無関係で雲をつかむような派生商品である。
デリバティブその他に関しては、こちらに簡単な説明がある。また、こちらには詳しい説明があるが、私には少し難しかった。
他にも、こちらを是非参照して欲しい。
最初に戻る
March 25
CPUメモリー転送能力のナゾ最終編(Pentium-2,P55C,
K6,CyrixMMXを同クロックで比べる編)
おまたせしました。手元にK6が到着した。正確に言うとK6-200ALR(Core:2.9V,I/O:3.3V)を積んだ、FM/V-MV205が到着した。このマシンは富士通の鬼っ子でいずれ詳しく紹介したい。
ごたくは並べずにこれを見て欲しい。計測はバス66MHz,CPU133MHz(2倍)で行った。Socket7群は、ASUSのSP-97V(SiS5598、PBSRAM512KB)、32MB、ビデオVirgeDXで、BIOS設定もCore電圧もそのままでCPUのみ差し替えた。Pentium-2は、Mycompの440FX、64MB、Permedia2で行った。計測はWintune97を用いた。wol2はL2キャッシュ無効という意味。
readの4kBと8kBの値はP55Cがやけに良いが、この当たりはプログラムの性質上信頼性が低いので目安として見て欲しい。
まずPen2は全般的に遅い。このPen2の写真は266MHzのもの。特にL2キャッシュ無効だと、socket7群と大差無い。L2キャッシュ有効だと512kBまで同じ数字が並んでいるが、6x86MXには全般的に負けている。P2は高クロックで稼いでいる印象で、6x86MXのクロックが接近してくれば、完敗するであろう。
L2キャッシュ有効、無効に関係なく、6x86MXが一番早い。特に、Read32kBから64kBにかけては抜群で、ユニファイドL1キャッシュが効いているのだろうか。L2キャッシュ有効、無効の差も大きめでキャッシュの効きも良いようだ。
期待を裏切ったのはK6である。唯一Read32kBで良い以外はP55Cとどっこいで、6x86MXには全般的に負けている。K6のL1キャッシュは64kbだがユニファイドで無いのが効いたのかもしれない。
不思議なのはP55Cで、L2キャッシュの有効無効での差が小さい。インテルのチップセットはL2キャッシュがカバーするメモリー量が小さいのは、以外とこのあたりに原因があるのかも知れない。
次にメモリー書き込みはどうか?
書き込みに関しても4kBはあまり信用できない。Pen2は6x86MXやK6より全般的に遅くP55Cと大差無い。
6x86MXは全般的に早いが、Write32kBのみK6に負けている。256kB以上はドングリの背比べである。
そうそう、6x86MXには隠しワザがあった。Linear Burst modeである。
図中、6x86MXlbというのがそれ。主にReadの64kBから512kBにかけて10%内外の改善があり圧勝であった。ここでは図に含めていないが、殆どのサイズでPen2にも圧勝している。同様に図示していないが、書き込みで256kbでわずかに改善する以外は、linear Burst modeの効果は無いし、原理的にも無いハズである。
というわけで、今回は6x86MXの圧勝に終わったと書きたいところだが、FPUはどうなったかという意見があるかも知れない。
FPUは、今回のBENCHMARKに関する限り、P55CとK6はほぼ同じで、Pen2と6x86MXはそれらの約70%にとどまった。Benchmarkのコードにもいろいろと問題があろうが、6x86MXのFPUがP55Cの70%というのは、そんなものであろうと思うが、Pen2はどうしたことであろうか?16bit命令にoptimizeされていないのであろうか?
Integerに関しては、どれもほぼ同じであった。通常は6x86MXが同クロックでは一番成績が良いはずだが、Dhystoneのコードやサイズの問題で大した差が出なかったようだ。
Videoに関しては、6x86MXがやや良く、ついでP55C、そしてK6であった。P2はSocket7群よりかなり良かったが、ビデオカードのPermedia2(8MB)とVirgeDX(2MB)の差であろう。
結論
以前のメモリー転送能力の図は、マシンやクロックが異なっていた。今回はクロックもマシンもまったく同じなので、かなり公平な比較ができるであろう。
結論として、Socket7群ではメモリー転送能力に関する限り6x86MXが圧勝であり、K6は全般的にP55Cよりやや良い程度であった。K6には、キャッシュを最適化するソフトがあるそうなので、これも近々試してみたい。
予想通り、P2は同一クロックではまったく大したこと無いCPUで、現状では高クロックで稼いでいる感じ。
Integerでは大差が付かなかったが、FPUは6x86MXの弱点であることは確かだ。ただしbusinessアプリではP2に肉薄することが知られているので、ゲームや3D以外は6x86MXがオトクである。
K6はP55Cよりマシであるが、大したことは無い。一部で人気沸騰のようだがWebmasterはあまり良い印象は無かった。
なお、データや測定条件の詳細はこちらで参照できる。
最初に戻る
March 20
PPP接続をロハで高速化する方法のナゾその2(山本式ブロックモード設定であと15%稼ぐ編)
このページを読んだ方から厳しい要求が来る。
”いつも「今日のトクする一言」を読んでいます。ネットワーク構築の仕事をしていて役に立ちます。これからは毎日更新してください。”
けっこう厳しい。もし毎日そんなにウマイ話があるとすれば、それはエンジニアがサボっている証拠かも知れない。実は前回のPPPの記事も、パケットサイズに関する伏線はこちらに、2年前から書いてある。
さて、今回はモデムの設定をいじって、あと15%以上スループットを改善する、という無謀な話である。そんなに毎週毎週ウマイ話があるのか???
しかし、残念ながらあるのである。
実は、WebmasterはいまだMicrocomの28.8kbpsモデムを使っている。仕事場にはIP接続の端末群があるのに、自宅が古いモデムでよく我慢できると思われるかも知れないが、あまり不自由していない。
一つは、最近まで同番移行ができなかった事、そして電話がホームテレホン連動の複雑なトポロジーだからある。というかWebmasterが怠けモノなのだ。最近ルーター式TAが出てきたので、機種を当たっている。
不自由しない理由の一つが、転送速度がまずまず出ることがある。図は、遅いことで有名なBekkoame経由でNetscape(圧縮済)をダウンロードしながらブラウジングした実測スループットで、あまり不自由していない理由がわかるだろう。ISDNだとピーク値は倍になるかもしれないが、積分値が倍になるとは思えない。
仕事場のIP接続端末から、回線の太い所とは20kbytes/s程度でつながる一方、回線の細い所とは1kbytes/secに満たない。現状のISDN64では仕事場の専用線に比べはるかに遅いし、回線の細い所ではモデムと差が無いので、いまひとつインセンティブに欠ける。
さて、モデムでスピードを稼ぐコツであるが、まずモデムの銘柄選びですべてが決する。個人的に信頼しているのは、古いHayes、Microcom、USroboticsなどで、国産ではアイワやオムロンあたりか。当然すべて外付けである。
以前よりPHSでインターネットに多くの質問が寄せられたが、トラブルの多くがPソニックのカードモデムだったのには驚いた。またか、という感じである。MegaHerzを勧めたところ、ことごとく解決したので、これまた驚いた。プロバイダーの集合モデムは殆どが舶来製で英語しかしゃべれないから、国産大手といえども英語がヘタなモデムではだめである。
Webmasterは貧乏性でジャンクに弱いが、ことモデムに関しては安物を買うと結局時間のロスになるので避けている。安物にも良い物があるが、見分けるのが難しい。アドバイス通りMegaHerzにしたらPHSでもうまく繋がったので、お礼にPソニックのカードモデムを差し上げますと言われたが、丁重にお断りした。
また、モデムはランプや液晶など、インジケーター類が付いているモデルを買う。いったんモデムは繋がってしまうと、ステータスが読めない。遅いなあ、と思っているととんでもないモードで繋がっていたりする。インジケーター類はコストを喰うので、付いているモノは自動的に上等なモノということになる。
webmasterは内蔵モデムはオマケでない限り絶対買わない。内蔵モデムはインジケーター類が無いし、パソコン内のノイズを引く。また、万一モデム不調時にパソコンごとリセットする必要がある。
またケースの通気性の良いモノを選んでいる。通風に不安があれば、ゴム足をつけて筐体を床から浮かしている。ケーブルにはノイズフィルターを付けている。
現在使っているのは、MicrocomのDeskporte28.8Sで、当時代理店のヒューコムがV34ESIIとして売っていた。その後Microcomは日本支社を作り、ヒューコムと後継機の名称を巡って裁判になった程ポピュラーな製品である。
これを買った理由は、Microcom製という事につきる。現在CCITT(ITU)で標準化された多くのプロトコールが、MicrocomのMNP(Microcom Network Protocol)由来だ。MNPのクラス1から3はパブリックドメインになっており、上のクラスも普及している。もうひとつは、プロバイダーがMicrocomの集合モデムをよく使っている。自社の製品同志の方が繋がりやすいのは当たり前である。
Webmasterは、当初ヒューコムやMicrocomのwin95用セットアップ用ファイル(INF)を使っていたが、なかなか3.5kbytes/sを越えなかった。V.42bisでは最大4倍の圧縮が効くハズなのにである。
もちろん、ダイヤルアップPPPではパケットで送るのでヘッダーが付くし、返事が来ないと次のパケットが送れない。さらに画像やファイル類は殆どが既圧縮だから、それ以上圧縮が効かないのだと納得していた。
しかし、マニュアルを眺めると工夫の余地があった。それは、MNPブロック転送制御で、デフォートではストリームモードになっている。これをブロックモードにすれば、15%以上スループットが改善し、既圧縮ファイルでも軽々3.7kbytes/sを越えるようになった。
コマンドはAT\L1である。モデムによってはAT/L1らしい。MegaHerzのモデムではマニュアルには無いが設定可能のようだ。国産モデムでは設定がマニュアルに載って無いが、設定自体が無いのか単にマニュアルに載せていないだけかは不明。
MNPにはいろいろなクラスがある。クラス1から4まではエラー訂正プロトコールで、データをパケットに割って送り、エラーが見つかったら再送する。
クラス1は半二重でエラー訂正する。クラス2は全二重でバイト単位でエラー訂正する。クラス3は全二重で、スタートとストップのビットを削ってスループットを110%とした。クラス4は、回線の状態によってパケットのサイズを変え、さらにヘッダーを圧縮して効率を上げる。V.42(LAPM)はMNPクラス4を基本にしたエラー訂正プロトコールである。
クラス5では、データ自体の圧縮が加わる。同じ文字が連続する場合は、文字と繰り返し回数を送る。また、頻度の高い文字に少ないビット列を、頻度の低い文字に多いビット列を割り振って圧縮する。V.42bisはMNPクラス5から発展したプロトコールで、最大4倍の圧縮率を持つとともに、既圧縮データなどへの対応が上手になっている。
脱線した。通常、エラー訂正はV.42、圧縮はV.42bisが優先して選ばれる。モデム間のデータはブロック(パケット)に分けて送られるが、ストリームモードでは、送られるデータがとぎれるたびにブロックにして送られるので、ブロック長は不定となる。一方ブロックモードでは、回線の状況に応じて決まったブロックサイズで送られる。
ppp接続のtcp/IPでは、データはパケット単位で送られてくるから、ストリームモードの方が良さそうなもんだが、ブロックモードの方が相性が良い。おそらくブロック生成のオーバーヘッドが小さいのか、あるいはtcp/IPのレイヤーで等長ブロックの方がフラグメンテーションしにくく処理が早いのかは不明。コマンド名はMNPブロック転送制御となっているがV.42時も制御が有効のようだ。
他にもMNP拡張サービスというのがある。これをサポートするモデム同志では、LAPMに優先してMNPクラス10のネゴシエーションを行う。コマンドはAT-K1である。
MNPのクラス10とは、移動無線などで回線の状態が変動する場合にエラー訂正を動的に変化させるプロトコールなので、圧縮率には直接関係無いが、回線状況が悪い場合は有効であろう。
モデムに関してはwebmasterはシロウトなので、どうしてブロックモードの方が能率が良いかの説明は推測にとどまる。しかしながら、この2つをデフォートのままにした伝送速度のデータがこの図だが、先の図と良く見比べて欲しい。ピーク値が15%程低く、伝送の密度にムラがある。MTUは576である。
実際の設定は、マイコンピューター、ダイヤルアップネットワークで、作成したプロパティーを開き、接続の方法の設定をクリック、接続のタブで詳細、を指定し、追加設定でat&p3\L1-k1と設定した。
最初の&pは、パルスダイヤルの20pps設定で、貧乏なwebmasterは未だミカカにパルスダイヤル料金しか払ってない。普通の文明人はat\L1-k1と設定することになる。モデムが違うと当然コマンドも異なるので、各自探ってみて欲しい。
いうわけで、残念ながらロハにして簡単に15%ピーク値が改善してしまった。ネットワークの世界には、相当仕事をサボっているエンジニアが多いことがバレてしまった。
以前のMTUやRWINの改善と組み合わせると、その効果はフェノミナルなモノがある。たとえパソコンをP54C-133MHzからペンティアムII-333MHzに変えても、これほどの能率アップは得られないであろう。
注意
今回の細工はWebmasterが苦心して編み出したオリジナルな方法で、国内外のどこの本にもホームページにも載っていないと思う。引用される場合は出典を添えて欲しい。こういった小細工は、ネットワーク、そしてパケット通信の根元に根ざす問題でもあるのに、長年ほったらかしされてきたのである。
なお、私のモデムではどう設定しますか、という質問はご遠慮願いたい。
最初に戻る
March 14
PPP接続をロハで高速化する方法のナゾ(tcp/ipとEthernetの本質に迫る編)
以前にも書いたが、メーカーや通信会社のエンジニアと話しているとメマイがすることがある。今では、電気に縁の無い会社員や自営業や学生まで、やれモデムだ、DSUだ、TAだ、ルーターだ、DNSだとか知っている時代だ。”会社が研修で教えてくれなかった”では済まないと思うのだが。
さて、RealAudioで楽しんでいただけただろうか。あの音楽は、古いサウンドブラスター専用CDドライブで音楽CDを演奏しながら、SB16のミキサーで混ぜただけである。一部でナレーションが無いとか、顔が映っていないとの指摘があったが、出演者とカメラマンとパソコンオペレーターを一度にするするのは難しい。
さて、モデムやTAの細い回線でどうやってビデオを転送するかである。圧縮方法は画質や音声から見当がつくのだが、プロトコールについては詳しくは書いてない。しかしモデムのランプの付き方から推測すると、パケット(データグラム)に細工があるようだ。ヘッダーが短いパケットをどんどん送ってくるようで、こちらからの返事はまばらなのがミソのようだ。
インターネットの基本であるtcp/IPは、データ転送技術tcpと、それをちゃんとした宛先に届ける技術IPからなる。データ転送の原理は、インターネット、携帯電話、PHS、パケット無線、宇宙通信でも同じで、大きなデータをパケットという小さな単位にバラバラにして送る。プロトコールと言えば一番馴染みがあるのは、パソコン通信ではなかろうか。
パソコン通信で、データ転送の一番簡単なプロトコールはXmodemだろう。データを細切れにして、その頭に番号札(ヘッダー)を付ける。シッポにはデータが途中で腐っていないかどうか調べるためのチェックサム(もしくはCRC)を付けておく。双方でよーいドンで送信と受信を始める。
送り側はパケットを送る。受信側はパケットが腐ってないかを調べ、OKなら”次を送れ”と返事し(Ack)、パケットからヘッダーとシッポをはずしてデータを組立てる。もしパケットが腐っていたら”再度送れ”と返事し、再送させる(ARQ)。音声や画像のように、少々データが欠落しても前後から補完できる場合は、腐ったものはそのまま捨てる(FEC)。
tcpの場合も同じだ。ヘッダーには送り先のアドレスやデータの順序などの情報が含まれる。パケット全体の大きさがMTU(Maximum Transfer Unit)で、その内の純粋のデータ量がMSS(Maximum Segment Size)だ。ヘッダー等のサイズが最低40bytesあるので、MTU = MSS + 40という関係にある。
通信経路が長くなると、返事に時間がかかる。この場合、パケットのサイズを大きくすればデータ転送の能率が良くなる。しかし通信回線ではエラーが付き物で、一旦データが腐るとわざわざ大きなパケットを再送するので能率が悪い。通常、通信品位の良い回線ではパケットサイズが大きく、品位の低い回線ではパケットサイズが小さい。またネットワークによっては通せるパケットのサイズに限界がある。
そこで、パケットをまとめて数個受信する毎にAckを送り返す事にする。tcpではRWIN(receive window size)がそれで、通常パケット数個のデータを受ける度にAckを送り返す。従ってRWIN= N x MSSという関係が成り立つ。Nは4ないし8ぐらいが常識的だ。RWINを大きくすると能率が良くなる代わり、腐ったパケットが混じっていたらRWINすべてを捨てて再送要求する可能性が出てくる(ワザとぼかした表現)。
さらに通信経路が長くなり途中でパケットが行方不明になると、双方がダンマリになる。このためパケットが届かなかったら、再送要求を出す。どのくらいダンマリがあると再送要求を出すかの指標(hopsに対する)がTTL(Time to live)である。これが長いとダンマリ時間が長くなって能率が悪いし、頻繁に再送要求を出すと入れ違いで通信がちぐはぐになる。
というわけで、MTU、RWIN,TTLという数字は、通信回線の品位、伝送速度、遅延時間によって最適な値がある。LANに使われるETHERNETでは高速で信頼性が高いのでMTUが1500だが、インターネットでは576、ATMやappletalkではさらに小さい。
そこで問題はWindows95である。win3.1の時に良く使われたTrumpetPPPでは、これらの数字を指定する事ができた。しかしwindows95の場合はレジストリーでMTUが1500に設定されている。なぜであろうか。
日本ではついに供給されなかったが、Win3.1とWin95との間にはWin3.11 for Workgroups(WFW)といバージョンがある。これはWin3.1のOSの基本部分を他のアプリより保護された階層で働く信頼性の高い32bitドライバー群で置換したもので、米国企業のLANでは未だ広く使われている。Win98とかWinNTのロードマップを読む上でWFWの存在は重要だが、程度の低い日本の雑誌はこの事を忘れている。
Win95のネットワークがまずまずの信頼性で登場したのは、主要部分の多くがWFWとWinNTからの借り物だからである。LANに比べ、ダイヤルアップPPPというのはかなり新しい概念で、既存のライブラリーに接ぎ木した構造になっている。それが理由で、Win95のダイヤルアップPPPのMTUはEthernetと同じ1500bytesのままなのだろう。
しかし、プロバイダーのサーバーは大半がUNIX系で、UNIXの世界ではMTUは576bytesが多い。(もっと古くは1006だった)。PPPでパソコン端末からデータを送ると、1500bytesは576bytesに分解され、生じた余りもパケット一個を占めるので能率が悪いし、分解と組立に要する処理も負担になる。これをフラグメンテーションと言う。ハードディスクのクラスターサイズの問題と同じである。
この様子はWin95に附属しているpingを使えば観察できる。これで目的とするWWWサーバーまでの時間を計るのである。ここで注意して欲しいのは、1500bytesを越えるデータは絶対にpingで指定しない事である。ネットワークやサーバーによっては、ダウンする恐れがある。書式は、
ping xxx.xxx.xxx.xxx -l 576 ping xxx.xxx.xxx.xxx -l 1500で反応速度を見てみる。576と1500ではずいぶん差があるだろう。フラグメンテーションの影響を見るには、
ping xxx.xxx.xxx.xxx -f -l 1460
とすればよい。どのサイズが一番能率が良いかは、ネットワークによる。大量のデータをサーバーにアップロードする時は、パケットサイズが小さすぎると、同じデータを送るのに多くのパケットを送ることになる。パケットにはヘッダーが付くから能率が悪くなる面もある。しかし、フラグメンテーションによるネットワーク全体の負荷を考えると、トータルでは若干早くなることが多い。それぞれの環境で、一番良い数字を探って欲しい。 ネットワークサーバーからはMTU=576(MSS=536)でパケットを送ってくるので、RWINも2144(2144=4x 536)にして、端末のバッファー上でフラグメンテーションが起こらないようにするのも大切である。
Windows95では、レジストリーにその設定がある。レジストリーをいじるので、まずsystem.datとuser.datを適当なディレクトリーにコピーしてバックアップを作って置く。そして、レジストリーを書き換えるソフトを下記で入手する。
http://www.sysopt.com/maxmtu.html
Webmasterは設定が一番簡単でフリーのppp-boost.zipを愛用しているが、他にもいろいろある。MTUを変えながらベストのサイズを探るシェアウェアもあるようだが、違いを納得するには、ロハのpingで十分だし、ハードディスクのコヤシにならない。
効果はさまざまであるが、印象としてダンマリの時間が減って、スループットが全体的に改善したように思う。転送速度自体の上限はもちろんモデム速度を越えられないのだが、特に、トラフィックが込み合っていてルーターの負荷が重い場合に効果があるようだ。おそらくルーターが単にパケットをやりとりするのより、フラグメンテーションによりリソースを喰われるのだと推測している。
転送速度を図示したいムキは、Win95に附属してくるネットワークモニターツールのインストール法中の解説を参照して、ネットワークモニターツールをインストールしてみて欲しい。MTUの細工で、転送速度の積分値が改善している様子が見えるだろう。
MTUの問題について、さらに詳しく知りたいムキは、
に情報が多いが、英語の上、内容がやや古いので、本日の内容位で十分であろうし、Webmasterもこの程度しか知らない。他にもモデムに細工してあと15%以上速度を稼ぐ方法があるが、それは近く報告する予定である。
ご注意(追加)
もしWin95によるLANがありそのサーバーからpppでISPに接続している場合は、RWIN設定に注意が必要だというメイルを頂いた。MTUはETHERNETとpppは個別に設定できるが、RWINは共通だと言う。このため、RWINをMSS x 4に設定すると、ETHERNETに対するRWINが過小となり、LANのスループットが低下するそうだ。ppp接続とISPの環境にもよるし、自分で試したワケではないが、この場合はRWINはEthernetに併せて 1460の数倍にしたほうが良いように思う。ご経験のある方は、ご教示いただきたい。
すこし更新をさぼっていたようで、申し訳ない。なんせ今週は2回も近県まで日帰り出張があったためである。以前はDECハイノートとPHSでモーバイル更新していたのだが、最近はオクラ入りしている。もちろん、Webmasterが惰眠をむさぼっていたワケではない。ネット史上初の、RealVideoによるマウス改造法をビデオでお伝えするためにツメを研いでいたのである。
世の中には、ちょっとした汚れですぐポインターの動きが渋くなるマウスがある。本日のサンプルは、FM/Vについてきた、史上まれなるダメなマウスで、内部ローラやボールを掃除してもすぐ動きが渋くなる。
こういうときは、マウスのボールを固定しているフタをハズして机の上に置いてみて、動作が良くなればフタの設計が悪いと判断して良い。
この場合、フタの穴を紙ヤスリで大きくすると簡単に解決する。相当穴を大きくしても、ボールが落ちなければかまわない。その様子を無謀にもネット上でビデオで紹介しよう。
まず、無償のRealPlayerVer.5をダウンロードして欲しい。これで世界中のニュースや番組のビデオが、28.8kbpsモデムで十分楽しめるので是非勧めたい。Webmasterは人気ボーカルユニットSPEEDの歌と踊りが大変気に入った。次に、
をクリックしてみて欲しい。うまく再生できたであろうか。この画像は、MACNICAのCUCMEE用のカラーCCDカメラ(モニターの上にちょんと乗せるヤツ。実はNECのOEM)を使って撮影した。MACNIAのページにはロクなソフトが乗っていないが、某社のホームページに、これのVideo for Windows95 ドライバーとビデオキャプチャーソフトがロハで存在する。これで、320x160x24bitsの解像度の毎秒5コマで撮影したところ、非圧縮AVIファイルで19MBにもなった。これを、Real Encorder ver5で28.8Kbps用にエンコードしたところ、なんと19MBのファイルが70kBと200分の1以下になった訳である。ビデオをみてもらうとわかるが、背景が動いていないのがミソである。
こういったビデオの圧縮の技術に関しては、
また、音声の圧縮技術に関しては、
を参照していただくと良いかも知れない。最後に大書しておくが、今回のソフト類はすべてロハである。ロハで最大限のメディアを提供するのも、高度のエンジニアリングの賜物であると思う。
イントロ
最近のパソコンのオーディオ関係にはひどい品質のモノが横行している。サウンドカード上のメインアンプがひどいことは有名であるが、だからといって出力をオーディオアンプに出力すると、余計にパソコン由来ノイズが目立って仕方がない。
サウンドカードのノイズ取りについては、スーパースロットスタビライザーを参照いただくとして、山本式バーチャルサウンドシステム(Virtual Sound System for PC PAT PEND.)によって臨場感を盛り上げることを考えたい。
原理
スピーカーマトリックスを用いたサラウンドサウンドシステムについては、
でかなり詳説した。このシステムは極めて有効だが、スピーカーを4個必要とする。もちろん4個使っただけの効果はあがるものだが、何とかして前スピーカー2個だけでサラウンド効果を得ることはできないであろうか。これがWebmasterのここ1年の課題の一つであった。
ちまたには、DSPを用いて2個のスピーカーで臨場感を高める機能をつけたヤマハの製品があり、店頭で試聴した事がある。しかし、その音質はとても耐えられるモノではなかった。残響に周期的な成分が乗っており、まるで電波状態の悪い時の携帯電話のように、ワウ、ワブルが感じられる。こんな音を聞かされるユーザーも哀れではあるが、確かに臨場感はある。他の市販DSPプロセッサーもいくつかあるが、Webmasterの耳で解析したシカケはおおむね次のように思えた。
1.遅延による残響効果
臨場感を得るための古い方法である。真空管アンプの時代にも、リバーブユニットという、バネを使ったシロモノがあったが、とてもHiFi(いまや死語)とは言えなかった。このため、レコード会社では、地下にコンクリで作った残響室を使っていた所もあった。
DSPでは、時間の遅れた信号を加算する。具体的にはターゲットとするホールで短いパルス性の音を出す。そして客席でそれを記録し、その伝達特性を記録する。DSPから出力される音は、原音に伝達特性を乗じた物で、原音との差が残響特性になる。この原理は携帯電話やインターネット電話、RealAudioなどで使われているLPCという方式と原理的に同様である。詳細はこちらのLPCの項を参照して欲しい。
この処理は簡単だ。ただ、トランジェント特性がまだ練れてない。ホールなどは音が後方に向かうにつれてその伝達特性が変化するのだが、そのシュミレーションが単純なので、程度の高い人には耐えられない。
2.位相操作
これは原理的にはスピーカーマトリックスと同じである。右(R)後方に右ー左(R-L)の成分を出力し、左(L)後方に左ー右(L-R)の成分を出力するわけである。これは単なるアナログ操作でも可能であるが、DSPであれば容易だ。
ボーカルや低音は同位相成分が多いので、単純に差をとったのでは打ち消されてしまう。そこで差信号の低い音をカットし、それに遅延を組み合わせると臨場感を高める。
しかし、市販のDSPプロセッサーの音を聞いても、何となく自然な感じがない。この手の信号操作に対する批判は結構昔からあり、たった2つのチャンネルの情報からそれ以上の情報を作り出すのは不可能という説も根強い。 このため、過去にも4チャンネル立体音響というのは、何度も蒸し返されたにも関わらず定着していないわけだ。Webmasterもかなり試行錯誤を重ねてきた。しかし、左右の差信号をよく聞くと、そこには極めて自然な環境音や残響音が多く含まれる事がわかる。
したがって、山本式バーチャルサウンドシステムでは既存の環境音や残響音を最大限に生かすことを目的とする。試聴を重ねて
右のスピーカーには R-(L/3) 左のスピーカーには L-(R/3)の音を出力することとした
3.実際の回路
実際の回路を図示する。あまりにも簡単で腰が抜けるかも知れないが、高度なエンジニアリングの産物(笑)である。動作原理の説明の必要も無いと思う。
いろいろ試行錯誤の結果、部品は1個にまで収束した。抵抗値は、当然スピーカーのインピーダンスによって異なるが、1ないし2オーム程度が良いようだ。抵抗を大きくするほど音場が広がり、小さくするとただのステレオに戻る。実際に2オームで制作しておけば、端子板に抵抗をパラに入れることにより調節できる。
実は当初右のような回路だったのだが、試聴の結果コンデンサーは不要であることがわかった。当初、差信号により低音が減少することを危惧したが、低音では上昇するスピーカーのインピーダンスに比べ抵抗値が相対的に低下し差信号は減少する。炭酸ガス排出の面からも部品は少ないに限る。
実装の具合は写真のようになる。部品はプラグと電線、抵抗一個とプッシュ型スピーカー端子である。グラウンドはスーパーウーハー接続のためと、抵抗の調節用に端子板にも出している。さりげなく抜け止めに一結びした電線やシュリンクチューブの具合に、Webmasterの美学がわかってもらえるであろうか?(笑)。この小物は、サウンドブラスターの出力にいろいろなスピーカーをつないだり、スーパーウーハをつなぐのに便利で、一つは作っておく値打ちがある。
さて、出来上がりの音は試してもらうのが一番であるが、部品が少ないだけあって素直な音である。それに加え、音場が左右のスピーカーの外側にも自然に広がる。このため、スピーカーの設置場所に柔軟性が出てきて、たとえ左右スピーカーの間が狭くても広がりのある音場が得られる。当然ひずみは全く感じられない。
こうしてみると、未だオーディオには未開発の部分が多くあることがわかる。いかに既存のオーディオが袋小路に陥っているかを考えるのに最適な日曜日の工作であろう。
最近事務雑用が多いせいか、パソコンネタが多くて申し訳ない。それにしても、アマノジャクなWebmasterの場合、何とかBENCHではいくつでどっちが早い、とかありきたりの話題を書くワケには行かない。損な性格である。
このページはReadmeJに登録しているが、テクニカルなページとしては3位ないし4位あたりをウロウロしている。さすがに上位ページはどれもポリシーがしっかりして、本当に懲りなかったり、FASTでFIRSTなページだったり名前通りである。ReadmeJに登録したのは最近で、さるページのマネしたのであるが、登録リストを見てまたびっくりした。もともと私が良く行くページばかりでは無いか。広いようで狭いネットであった。
”結構ネタ集めが大変でしょう?”とメイルを頂く。今のところ、Webmasterは本業のネタは一切使っていない。もしその方面を使えば10年分?はあると思うが、敢えて日常の物を題材にすることにしている。医学の話が出だしたらネタ切れと思って間違いない?
さて、石油ファンヒーターについては、
お年玉巨編(笑) 石油ファンヒーター大研究その2(メカニズム編)
お年玉巨編(笑) 石油ファンヒーター大研究その1(費用編)
以来である。ファンヒーターというのはいかにも日本的な製品だ。必ず3時間で切れて換気が必要なハズだが、なぜか延長ボタンがあったりする。石油なので着いたり切れたりすると、ニオイが出るし、いつかは石油を補給しなければいけない。
そこでメーカーは頭を絞る。インバーターエアコンにしてもそうだが、まずトロ火から最大火力までの調節幅を広くするのがミソである。トロ火が効けば、いちいち消火着火を繰り返す必要がないし、石油が長持ちする。
この点では、最近はトロ火燃焼に有利な丸形バーナーに収束しつつある。丸形だと、絞っても均一に火がまわるので、安定する。最小能力は売れ筋の2500Kcalクラスで、コロナが430Kcal、サンヨーが480Kcal、東芝が480Kcal、ナショナルが510Kcalとなっている。
丸形バーナーはさらに2系統に分かれる。石油を空気で霧吹きするベンチュリー式(コロナ、サンヨー)と、専用の気化器を使う電熱気化器式(東芝、ナショナル)である。電熱式気化器式は、着火時や消火時のコントロールが容易で着火時電力も小さい(東芝で102W)が、気化器に常時通電するために燃焼時電力(東芝で最小43W)が大きい。燃料のタール分に弱いので、タール焼き切り機能が必要だ。
何かと無用に凝り性な東芝は、トロ火が苦手な2段列型バーナーから丸形バーナーに総入れ替えしたようだ。ラインフロー式送風ファンも一般的な軸流ファンへと、まっとうな設計になって来た。
一方ベンチュリー式(図はコロナへのリンク)では、着火時にバーナーケース全体を加熱するので着火時電力が大きい(コロナで380W,サンヨーで600W)が、いったんバーナーがあたたまれば加熱が不要なので燃焼時電力が小さい(コロナで最小12W、サンヨーで13W)。また燃料の質をあまり選ばない。
これらのメーカーはバーナーのデザインに自信があるらしく、殆ど形状に変化が無い。サンヨーは燃焼用ファンとバーナーが結合した美しいデザインだが、素っ気ないデザインのコロナの方が着火も早く、ニオイも少ないのが不思議である。
ナショナルは、ブラシ式気化器と小型バーナーベースを合体させたシロモノに替えてきた。ちょうど性能も気化器式とベンチュリー式の間を狙っている。消費電力も着火時660W、燃焼時最小16Wと、気化器式でありながらベンチュリー式の消費パターンだ。
基本性能より目に見える小細工が得意なナショナルは、送風ルーバーを電動にして着火するまで閉めておく事と、プラチナ触媒を仕込むことでニオイを封じ込める設計だが、それでも着火時に他社の数倍のニオイが出ている。
丸形バーナー陣営以外には、日立とシャープが四角形バーナーと電熱気化器を用いている。こちらも凝り性のメーカーである。丸形バーナーに比べると四角形バーナーはトロ火で不安定になりやすい。このため日立はメッシュやバーナーをチタンで作り、保温と触媒作用で安定化している。またシャープはバーナーにプラチナをコーティングし、触媒作用で安定させている。白金カイロの原理である。
この手の工夫で、日立は430Kcal、シャープは490Kcalまで絞れるようになっているが、気化器のため燃焼時も電力(日立で52W程度喰っている。
依然として独自の列型バーナーと、燃焼ファンを省略して送風ファンですべてをまかなう簡素な構造がダイニチであり、これも最近大きな改変は無い。また、驚くほど簡単な構造のレーザーバーナーのトヨストーブもあまり変化が無いので、詳細は略する。
さてタンクは大型化している。売れ筋の製品では7.2リットルに達している。タンクが大きいと補給回数が減るが重くなる。対策として大きな取っ手を着けるのが流行している。
しかしながら石油補給の度に、依然として石油に濡れたタンクの栓にさわらなければならない。また、締め具合もファジーである。いくつかのメーカーは栓をゆるめるゴムをオマケにしている以外、さしたる進歩がない。
この点で圧倒的に優れているのは、前年同様のコロナのよごれま栓だと思う。我が家でもこれを使っているが、危惧した故障や油漏れは無い。満タンブザーも面白い。
若干の改良を見せているのはサンヨーであり、給油名人という名前でバヨネット式の栓になっているが、使い勝手はよごれま栓に及ばない。もともとサンヨーは栓の直径が小さく、扱いにくかった。
問題なのは、小細工が得意なナショナルも、凝り性の東芝も、タンクの栓については改良が見られず、手抜かりを放置している事である。特に、小細工を弄するナショナルは、そのレゾンデートルを問われていると思うが。
というわけで、石油ファンヒーターについては、燃焼性能でも補給でも依然コロナが一歩リードしているように思う。平成11年モデルはどうなるだろうか。
景気低迷のおり、貧乏なWebmasterのように、エアコンを止めてファンヒーターにする家庭が増えるかも知れない。我が家では以前書いたように、全室電気のエアコンからファンヒーターに転換した。おかげで厳寒時も快適になった上に、最大月\20000以上の節約になっている。
おことわり。上記サンプルにM菱が無いとおこられそうだが、実物を観察するチャンスが無かっただけであり、他意は無い。
最初に戻る
March 3
L2キャッシュ有効でベンチマークが遅くなるCPUのナゾ(6x86MXとP55Cの違いを探る編)
以前、ベンチマークのコードサイズによってL2キャッシュの効果が異なる事について、
パソコンBENCHMARKとL2キャッシュ有無の関係のナゾ(本邦初、Webmaster渾身総集編)
で報告した。またメモリー転送能力に対するL2キャッシュの影響を、
パソコンBENCHMARKとL2キャッシュ有無の関係のナゾ(CPUのキャッシュ依存性グラフのおまけ編)
で報告した。
今回はP55Cで面白いことに気付いた。L2キャッシュ有効で逆に遅くなるベンチマークがある。また、P55Cと6x86MXでは、L2キャッシュ有無によるベンチマークのふるまいが異なる事も分かった。
こうしてみると、そもそも特定のBENCHMARKのみで異なるCPUの優劣を論議する事の空しさが実感される。また何を反映しているか解らない変なBENCHもある。
測定条件
P55Cは75MHzX2.5、VPXチップセット、Edo32MB,Virge/DXである。6x86MXは、SiS5598チップセット、Edo32MB、SiS内蔵VGAである。
HDBENCHの場合
P55Cでも6x86MXでも、L2キャッシュの有無による成績差は1%以下である。コードサイズは281kBだが、それぞれの測定項目のルーチンは、P55Cの32kBに納まるサイズであることが予想される。
Super-PIの場合
6x86MXはL2キャッシュ無しで計算能力は59%に低下した。一方P55Cでは75%に低下した。コードサイズが104KBなので、どちらのCPUでもコードはL2キャッシュ上に乗るはずである。
原因として、6x86MXでは、こちらのグラフの通り、128kB付近のL2キャッシュの効果がP55Cより高いため、L2キャッシュ無しの影響が大きいからであろう。
WINBENCH98の場合
まずCPUMARK32だが、コードサイズが161kBと、L2キャッシュの効率の高い付近にあると思われる。
6x86MXではL2キャッシュ無しで計算能力が45%へと大きく低下した。これはあらゆるBENCHの中で一番大きな低下である。一方、P55Cでは73%に低下したが、この方が実世界アプリや他のBENCHとも共通性が高い。
CPUMARK32が何を計算しているのか不明だが、えらく時間がかかるところを見ると、いろいろな些末なコードまで含めて、実世界アプリとかけ離れた変な計算をしていると思う。これがいろいろな雑誌で使われていることを考えるとめまいが起こりそうである。
FPUmarkはさらに変である。6x86MXではL2キャッシュ無しで計算能力は98%と、殆ど差が無い。これはコードサイズが79kBと小さいため、主要部分が6x86MXの64kBのL1キャッシュに納まるためであろう。
驚くことに、P55CではL2キャッシュ無しで計算能力は102%と逆に速くなる。理由だが、Webmasterの推測によると、コードサイズがP55Cの32kBのL1キャッシュからわずかにあふれるためミスヒットし、ペナルティーを食ってしまうのであろう。
本来はL2キャッシュがL1キャッシュを補強するハズであるが、逆にミスヒットを増やしてペナルティーを助長しているようである。かなりキャッシュアルゴリズムがプアなのでなかろうか。
Intel Media Benchmarkの場合
6x86MXではL2キャッシュ無しによる成績低下は、Totalで約86%である。個々に見ると、データサイズが12MBと大きいImageでは97%、3.2MBのAudioでは91%とL2キャッシュの影響が小さい。
P55CではL2キャッシュ無しによる成績低下は、Totalで94%と小さい。6x86MXと異なり、Imageでは99%と低下が小さいのに、Audioでは92%とやや大きくでる。あるいはビデオカードの影響もあるかも知れない。
いずれにしても、本当のCPUパワーを必要とする、コードやデータのサイズの大きなマルチメディアでは、L2キャッシュはあまり効かない。P55Cは6x86MXよりさらにL2キャッシュの効果が乏しい。また、CPUによって処理の得意、不得意があるようだ。
Wintune98の場合
まずDhrystoneであるが、6x86MXの場合にはL2キャッシュ無しで100%と、L2キャッシュの効果はまったく無い。これはコードサイズが53kBと小さく、L1キャッシュに乗ってしまうからであろう。
一方、P55Cでは95%の低下と、6x86MXより影響がやや大きい。やはりDhrystoneの大部分はL1キャッシュに乗るが、L1キャッシュが6x86MXより小さいため、若干ミスヒットしていると考えられる。
次にWhetstoneは、6x86MXではL2キャッシュ無しで98%に低下と殆ど影響は無い。一方P55CではL2キャッシュ無しで79%に低下と影響が大きい。これも、Whetstoneの一部はP55CのL1キャッシュからあふれ、かなりミスヒットしている事を示す。
メモリー転送速度とL2キャッシュ有無の関係はすでに示したので、ここでは触れない。
結論
こうやって比べてみると、CPUの優劣を単純なBENCHで比べることの難しさが実感される。CPUのコア性能だけでなく、キャッシュのサイズやアルゴリズムの性能がかなり影響してくる。こういう比較は、あるいはまったく意味が無い、と言う人がいても不思議では無い。
特に問題なのは、多くの雑誌が採用しているCPUmark32とFPUmarkの妥当性のである。これらの数字は、多くの実世界のアプリの成績や他のBENCHの結果ともかけ離れている。
これが権威ある雑誌由来なのでタチが悪い。Webmasterは、はっきり言えば時間がかかるわりに妥当性に疑問の残るBENCHだと思う。
特に面白いのは、FPUmarkで、P55CではL2キャッシュ無しの方が速くなる。P55CはL1キャッシュのミスヒットのペナルティーが大きく、キャッシュ制御アルゴリズムも上等でない印象がある。
Webmasterの手元によせられたメイルによれば、Writeにおいて6x86MXとP55cにはアルゴリズムの違いがあるそうだ。
P55Cのキャッシュアルゴリズムは、noallocate-on-writeと呼ばれるもので、書き込むアドレスがL1キャッシュ上に無い場合はチップ外に直接書き出され、それはL1キャッシュにすぐには反映されない。
6x86MXの場合は、allocate-on-writeと呼ばれ、書き込むアドレスL1キャッシュ上に無い場合は、チップ外からL1にいったん読み込んだ上でL1上に書き込まれる。書き込まれた内容は、CPUがメモリーバスを放した時にチップ外にwritebackされる。
従って、次回書き込まれるときに、そのアドレスがすでにL1キャッシュ上にありヒットする可能性が高くなる。これが、write能力が高い理由であると言う。
こうしてみると、6x86Mxはなかなか面白いCPUであることが分かる。まず同一内部クロックでは6x86MXが一番処理能力が高く、Pentium-ProやPentium-IIを上回っている。キャッシュの能力も32kBの6x86LでさえP55Cより高いようだ。K6についても調べる予定だが、まだ調達できてない。
実際にアプリを使っていると、6x86MX(66x2)はPRレイティングが同じP55C(166MHz)より速いような気がする。今後プロセスが改善して内部クロックが上昇すると、P55Cどころか今後登場が予想されるPentium-IIのコアを用いたsocket7タイプのCPUも霞むほどだ。
以前の互換性や発熱の評判が尾をひいたのか、大メーカーの採用が少ないが、1000ドルクラスではMediaGXの採用が増えていることから、今後は状況が変わるかも知れない。
いずれにしても、BENCHはあくまでもBENCHであり、結局ユーザーの印象がすべてであるとも言える。Webmasterのモットーは、
TRUST YOUR FEELING!
MAY THE CPU FORCE BE WITH YOU!
である。
最初に戻る
March 1
山本式スーパースロットスタビライザーのナゾ(風水学的ノイズ及び電圧降下根絶編)
来るべき高バスクロック時代を迎え、Webmasterも気が引き締まる思いである。以前から気付いていたが、高バスクロックでは、同じケースに同じマザーボードとカード類を組んでも同じ安定性をもつとは限らない、ということである。実装方法が効いてくる。
先日、パソコンの電源ファンの音が、パソコンがDozeモードに入る度に、わずかに低くなることに気づいた。Dozeモードに入ると、CPUクロックが約30%に低減されるためにCPUへの電流が減り、電源とCPUの間の電圧降下も減る。このためAT電源の負帰還回路が働き、電源の電圧がわずかに下がる。ということは、マザーでかなりの電圧降下が生じている事になる。
パソコンのマザーは多層基板で、ウラ、オモテの配線以外にグラウンドや電源の層がある。層は極薄の銅箔製で、面積があるので比較的電気抵抗は低いが、CPUが10A近くも消費するために基板内で電圧降下を生じる。基板内のグラウンド電位が一定で無い事は、風水学的に問題があり、また高いバスクロックでの安定動作の敵である。今回は、パソコン風水学的にノイズをも解決するのである。
このことはスロットに差すカード類にも悪影響を及ぼす。マザーとケースが電気的に等電位で接地されていないと、電源から電流がマザーからカード類を経て、ケースに流れることになる。このため、カード類にマザーや他のカードの直流成分やノイズが流れ込む事になる。最近ではCPUまわりのスイッチングレギュレーターのため、さらにノイズ環境が悪化している。
特にモデムやサウンドカードのように、アナログ回路にノイズが乗ること問題になる。SCSIカード類でも、ノイズマージンが減りターミナル電圧が不安定になると、誤動作の原因となる。
にもかかわらず、マザーはコストダウンのため、ケミコンやノイズフィルターの類は、極限まで節約されている。マザーを良く見ると、実装されていないケミコンのパターンが多くある。
実際、このマシンでは、サウンドブラスターにヘッドホンをつなぐとノイズがわずかに聞こえていた。マザーは金属製スタンドナット2個とナイロンナット類でケースに固定されていた。試しに6カ所全部を金属製スタンドナットでケースにがっちり固定したところ電圧降下が減少し、電源ファンの音も殆ど変化しなくなったし、サウンドのノイズも減った。
このように、マザーが高クロックで不安定の場合は、固定方法を見直す必要がある。その際、必ずマザーのウラの金属スタンドナットに接する面がグラウンドになっているかどうか確認する。またオモテのネジが周囲の回路に接触しそうな場合は、ネジに絶縁ワッシャー(茶色)を使う。
それでも、サウンドカードにノイズが乗ったり、あるいはビデオカードに縞模様が乗る場合におすすめしたいのが、山本式スーパースロットスタビライザー(PAT PEND.)である。
カードスロットの電源ラインを安定化させるのが原理である。ISAカードは、設計の不備により電源やグラウンドラインが少ない。この点、PC9800のCバスの方が、はるかに良くできている。
このため、スロット周りのノイズマージンが少ない。スロットにカードをさす順番によってノイズマージンが異なったりする。本来なら、マザーボードに直接ノイズ対策のコンデンサー類を追加するのだが、マザーをはずすのは面倒だ。
そこで、電源安定化のシカケを加えたスーパースロットスタビライザーカードを差すことにより、スロットを安定化させるわけだ。カード類のノイズ対策になるだけではなく、ひいてはマザーボードの動作自体を安定化させる。写真で示しているのが、追加されたケミコンである。
ISAカードでは、ウラ面の金具よりの方からGND、ひとつおいて+5Vとなっている。また9番目が+12Vで10番目がGNDである。また29番目が+5Vであり31番目がGND。さらに16ビット側では、金具から一番遠いのがGNDで、それから一つおいて前が+5Vである。
ここのところをワザと詳しく書いてないのは、シロウトを排除するためである。手元に確認する資料の無いムキや、書いてあることが何のことかわからないムキは、手を加えるのをあきらめて欲しい。また、今回の部品はエコロジーとリサイクルの観点から、
のカードから調達した。このため、余計な炭酸ガスは最小限しか消費していない。新たに調達するのであれば、帯が金色の高級オーディオ用ケミコンが望ましい。これらは高い周波数のノイズの吸収能力に優れている。ビデオ機器でも重要な部分に使われていたりする。
これらの接点からカードのパターンをたぐると、ケミコンもしくはタンタルコンがある。容量はだいたい16V10uF程度の事が多い。これにケミコンであれば16V500uF位をパラに半田ツケする。仕上がりは写真を参考にして欲しい。背が高くなると良くない。また、サウンドカードの場合は+5Vだけでなく、+12Vにも対策すると効果的である。
ケミコンの容量であるが、大きすぎるとスロットの接点が痛むし、少ないと効果が無い。ISAのスロットは接点容量が大きいので、500uFあたりが適当のようだ。PCIカードでも同様の対策が行えるが、ISAの方は接点容量が大きいので効果的である。
なお、ケミコンのどっちがマイナスかわからないムキや、実装方法がわからないムキは、この話の事はすっかり忘れて欲しい。世の中には、知らない方が良いことも多いのである。
これは、スーパースロットスタビライザーカード対策前後のサウンドブラスター16のノイズフロアをFFT解析したものである。ごらんのように、ノイズフロアもノイズピークも改善しており、サウンドカードとしてはかなりのノイズレベルを達成している。
マザーボードのネジ止め対策と、山本式スーパースロットスタビライザーカードにより、安物サウンドブラスター16の音質は劇的に改善し、ノイズはヘッドホンでも感知できなくなった。
老婆心コーナー
この改造は簡単で、カードの動作が良くなることがあっても悪くなることは皆無のハズであるが、ある程度のパソコンと電気工作の知識を要するので、書いてあることが解らない場合は、しばし調べてから試して欲しい。
この風水学的な改造は、エキスパートのみにしかすすめらないのが残念である。
最初に戻る
最初に戻る
E-mailばーちゃる耳鼻咽喉科へのリンク
Return to Home Page ホームページに戻る