タグ別アーカイブ: ノード

米動画配信のNetflix、Chaos MonkeyのおかげでAmazon EC2のメンテナンスリブートを難なく乗り切る - Publickey

NetflixがChaos Monkeyで試していたシステムの中には、同社がバックエンドデータベースとして採用しているNoSQLのCassandraも含まれていました。実は同社の今回のブログはこの部分がいちばんの見所になっています。

Last year we decided to invest in automating the recovery of failed Cassandra nodes. We were able to detect and determine a failed node. With the cloud APIs afforded to us by AWS, we can identify the location of the failed node and programmatically initiate the replacement and bootstrap of a new Cassandra node.

昨年、私たちは落ちたCassandraノードの自動リカバリに取り組むことを決断した。落ちたノードを検出することは可能であり、AWSによるクラウドAPIでそれがどのロケーションなのかを判別できるため、それを置き換え、新しいノードを立ち上げるプログラムを実現した。

この自動化を実現した上で、Chaos MonkeyによるテストにはCassandraが加わり、サーバが落ちても動作し続けるように検証が続いたそうです。

この結果、今回のAmazon EC2のメンテナンスでは、運用中の2700を超えるCassandraノードのうち218がリブートされ、そのうち22ノードのリブートが失敗したにもかかわらず自動的に復旧が行われ、全体としてはダウンタイムゼロでAmazon EC2のメンテナンスリブートを乗り切ったと報告されています。

Netflixのブログは、「パーシステントレイヤー(データベースのような永続的データを担当するレイヤー)であっても、レジリエンス(障害などへの対応力や回復力)の計画を持つべきだ。もしCassandraをChaos Monkeyのテストに加えていなかったら、今回の話は別の結果に終わっていただろう」と結んでいます。クラウド上に展開したシステムをどのように設計し、テストすべきなのか、大きな示唆を与えてくれているのではないでしょうか。

引用元: 米動画配信のNetflix、Chaos MonkeyのおかげでAmazon EC2のメンテナンスリブートを難なく乗り切る - Publickey.

LINEの暗号化について « LINE Engineers’ Blog

この事例では、一般的なPCとES2という日本のスーパーコンピュータを利用して暗号を解読するのにかかる時間を推定したところ、一般のPCを使用した場合は、RSA-1024より弱い暗号を使用した場合でも最低2000年以上かかることがわかりました。スーパーコンピュータのすべてのリソースを使用した場合でも、RSA-1024の暗号に使用されたキーデータを見つけるのにおよそ10年ほどかかるといいます。(スーパーコンピュータに存在する640個のノードをすべて使用した場合)

実際、LINEではRSA-1024よりさらに強化された暗号RSA-2048を使用しているため、暗号を強制的に解除するのはさらに難しいといえます。

しかし、問題はまだ残っています。それはPCの演算能力です。時間が経つほど性能が向上するため(1.5年で2倍ずつ向上:ムーアの法則)、既存の暗号方式はいつかは破られるだろうというものです。したがって、ある時点でさらに強力な暗号方式に変える必要があります。参考までに、RSA-1024暗号化方式は2019年までの使用が推奨されているため、現在の状況では安全な方式だといえますが、日々変化している暗号化解読技術やPC性能向上により、また状況は変わるかもしれません。

引用元: LINEの暗号化について « LINE Engineers' Blog.

駐在員に人気の「ブリティッシュ・スクール」をグローバル展開するノード・アングリアがIPO – Market Hack

ノード・アングリア(ティッカーシンボル:NORD)は世界で27の小中学校(→正確にはK to 12)を展開している企業です。その学校の多くは「ブリティッシュ・スクール」というブランド名を冠しています。同社はいわゆるプレミアム・スクール・モデルを採用しており、授業料は学生一人あたり年間273万円と高いです。同社はその地域にある他の学校の授業料より少なくとも50%、しばしば2倍の値段を請求します。なぜそのような高い授業料でも生徒が集まるかといえば、「ブリティッシュ・スクール」はターゲットを駐在員(エクスパトリエット)の子弟に限定しているからです。つまり社員を海外に赴任させようとする企業が「会社持ち」で子供の教育費を負担するわけです。このため同社は各国の政府から公的な支援を受けていません。(不動産だけは例外です)K-12の私的教育市場は580億ドル市場ですが、そのうちの89%は1校のみしか運営していない零細企業です。言いかえればプライベート・スクールの大半は教育には関心があるけれど、財務には興味が薄いわけです。また政府は普通、学校の免許を乱発したくありません。このため中国など海外の企業が中国進出し、%2

引用元: 駐在員に人気の「ブリティッシュ・スクール」をグローバル展開するノード・アングリアがIPO – Market Hack.

(2/3)[MWC2014]商用化へ近づくNFV、中国移動やSKテレコム、テレフォニカがトライアル結果を披露:ITpro

同社がトライアルによって学んだというのは、EPCやIMSに含まれる各ノードの役割ごとに、通信事業者のシステムとして求められるパフォーマンスや信頼性の要件が異なり、商用化に向けたハードルが変わるという点だ(写真5)。 例えば、IMS上で各種サービスを実現するAS(Application Server)といったサービス系のノード(Service Function)の場合、遅延は50ミリ秒程度でトランザクションやスループット、信頼性もそれほど高い性能は求めらない。NFV商用化に向けたハードルは低いと言える。 EPCに含まれるMME(Mobility Management Entity)やPCRF(Policy and Charging Rules Function)といった、実際のユーザーパケットを運ばないコントロール系のノード(Control Functions)の場合、遅延は1ミリ秒以下。スループットはそれほど求められないが、トランザクションや信頼性は高い性能が求められる。 そして、S/P-GWのような実際のパケットを伝送するノード(Pipe Functions)では、同じく遅延は1ミリ秒以下。こちらは、トランザクション性能よりも高いスループットが求められるといった具合だ(写真6)。

引用元: (2/3)[MWC2014]商用化へ近づくNFV、中国移動やSKテレコム、テレフォニカがトライアル結果を披露:ITpro.

複数のTor出口ノードからのSQLインジェクション攻撃をWAFで観測しました – WAF Tech Blog | SaaS型 WAFサービス Scutum 【スキュータム】

Scutumで観測される攻撃の多くは海外のものと思われるIPアドレスから送られてきます。先日、珍しくアメリカのボストン大学(bu.edu)に所属すると思われるIPアドレスから、SQLインジェクション攻撃を観測しました。海外からの攻撃が多いとはいえ、.eduドメインからのものは普段殆ど見かけることはありません。

調べてみたところ、どうやらTorの出口ノードであることがわかりました。

引用元: 複数のTor出口ノードからのSQLインジェクション攻撃をWAFで観測しました – WAF Tech Blog | SaaS型 WAFサービス Scutum 【スキュータム】.

エッジネットワークの分散ルータ構成は、物理ピアでルーティングできるところが強力すぎる | やむにやまれず

OpenVNetの分散ルータは、パケットの最終到着地を決定するために、エッジノード内部でルーティングを済ませ、物理のピアを決定してから転送をするものです。 VMルータのように、どこかにVMとして起動されていて、そこでルーティングの処理を集中的に行うものではありません。 全てのエッジノード内部にルーティングを解決する処理を持たせるのです。 物理ネットワークに対して集中型のトポロジをもたらしてしまうVMルータと対比して、OpenVNetでは上記のようなルーティングの仕方を、分散ルータと呼んでいます。

引用元: エッジネットワークの分散ルータ構成は、物理ピアでルーティングできるところが強力すぎる | やむにやまれず.

雲になったコンピュータ: 老舗クラウドストレージサービスの倒産-Nirvanix-

②多機能が裏目に? ・・・ もうひとつの問題はSDNの多機能にあったようだ。基本のストレージ機能でAWS S3に挑戦しながら、一方で世界展開のマルチノードを用いて、CDN(Content Delivery Network)市場も狙っていた。ここには元祖Akamaiがいるし、挑戦者のLimeLightもいた。③本当の顧客は誰か? ・・・ このような多面作戦の結果、本当のユーザーが見えなくなった。初期のパワーユーザーとコンテンツデリバリーなどの企業ユーザーから、暫時、一般企業向けに同社方針が移っていったことからもそれは推察できる。④マネージメントは? ・・・ 以上のような状況はマネージメントの混乱を伺わせる。創業以来、NirvanixのCEOは5人。特に昨年からはひどかった。2010年以来のCEOが昨年12月にOracleに移籍、CSO(Chief Strategy Officer)が今年4月まで暫定CEOとなり、その後、MicrosoftとCiscoで役員だった現CEOが就任した。全ては戦略の問題だったように見える。最近の同社のキャッチフレーズは“Enterprise Cloud Storage Company”である。

引用元: 雲になったコンピュータ: 老舗クラウドストレージサービスの倒産-Nirvanix-.

クイック マイグレーションをすると仮想スイッチが「構成エラー」になる(Windows Server 2012) – Ask CORE – Site Home – TechNet Blogs

Windows Server 2012 ではクイック マイグレーションによってターゲット ノードに仮想マシンが移動した際のリソース (ネットワーク デバイスなど) の修正は仮想マシンのワーカー プロセス (vmwp.exe) の起動時に、動的に仮想マザーボードの Power On 処理内で実行するよう変更されました。そのため、仮想マシンの起動のタイミングで正しい値に更新が行われる動作となります。

Windows Server 2008 R2 ではクイック マイグレーション時に仮想マシン管理サービス (vmms.exe) が仮想マシン構成リソースのオンライン処理の延長でターゲット ノード側の仮想スイッチ/ポート情報に適用させるよう構成ファイルの修正を行っていました。そのため、仮想マシンを起動する前のタイミングで既に構成情報は更新済みとなっています。

Windows Server 2012 からは仮想マシンのワーカー プロセス (vmwp.exe) が起動時に変更を行うため、上記のようにオフライン状態で クイック マイグレーションを行いターゲット ノードに移動した場合、このタイミングではまだ仮想マシン プロセスは起動していないため、仮想スイッチ/ポート情報の変更が行われておらず構成情報上は「構成エラー」という形で見えてしまうようになります。この動作の違いは仮想マシン内のリソースの管理を仮想マシン管理サービス (vmms.exe) ではなく、仮想マシンのワーカー プロセス (vmwp.exe) が個別にすべての権限持って行うよう、Windows Server 2012 の仕様として変更されたことに起因しています。

上記の通り、Windows Server 2012 ではクイック マイグレーション後に仮想マシンのワーカー プロセス (vmwp.exe) が起動するタイミングで初めて構成ファイルからターゲットホスト側の仮想スイッチを検索し、検出できれば仮想 NIC の割り当てが行われます。そして、その構成変更処理の延長で構成情報が正しい内容へ修正されます。そのため、仮想マシンの起動前のタイミングで表示される「構成エラー」は無視していただいて問題ありません。

引用元: クイック マイグレーションをすると仮想スイッチが「構成エラー」になる(Windows Server 2012) – Ask CORE – Site Home – TechNet Blogs.

クラスター環境で推奨されるネットワークの本数について – Ask CORE – Site Home – TechNet Blogs

環境 ノード毎に必要な物理 NIC の枚数と用途

フェールオーバー クラスター環境 2 (a)(b)

ライブ マイグレーション環境 + 2 (d)(e)

iSCSI 環境 + 1 (f)

引用元: クラスター環境で推奨されるネットワークの本数について – Ask CORE – Site Home – TechNet Blogs.

インターネットのどのページ間も19クリック以下で辿ることができるという研究成果が発表される | 秋元@サイボウズラボ・プログラマー・ブログ

インターネットのどのページ間も19クリック以下で辿ることができるという研究成果が発表される | 秋元@サイボウズラボ・プログラマー・ブログ: 彼によれば、現在のウェブ上にはおおむね1兆個の文書があり、(ページ数が全部で140億ページだという別の推計と、)それらの中でもっとも遠いノードの間でも、せいぜい19クリックで辿りつくことができてしまいます。