タグ別アーカイブ: GPU

【仮想化道場】ARMプロセッサとGPUに賭けるAMD ARMとx86プロセッサのピン互換を実現 – クラウド Watch

なお、APU化したARMプロセッサは、ネットワーク関連の組み込みプロセッサとしては、高い性能を持つかもしれない。GPUは並列処理性能が高いため、ネットワークを流れるデータパケットを高速に処理できる可能性があるからだ。こういった性能が認められれば、ファイアウォールやL3スイッチなど、専用チップを使って処理しているネットワーク機器で、APU採用が加速するかもしれない。

引用元: 【仮想化道場】ARMプロセッサとGPUに賭けるAMD ARMとx86プロセッサのピン互換を実現 – クラウド Watch.

「秘かに暗号通貨を採掘するアプリ」が100万回以上ダウンロード « WIRED.jp

暗号通貨「Litecoin」および「Dogecoin」(日本語版記事)の採掘(マイニング)を秘かに実行する2種類のAndroid機器向けアプリケーションが、公式「Google Play」ストアから100万回以上ダウンロードされているのが発見された。

セキュリティ対策ソフトの開発・販売を手がけるトレンドマイクロの研究者が3月25日付けで公式ブログに投稿した記事によると、ひとつは「Songs」というアプリケーションで、100万から500万回インストールされている。もうひとつは「Prizedで、10,000回から50,000回インストールされている(現在は販売停止)。

マイニング・アプリケーションは、CPUやGPUなどのプロセッサーに、新しいデジタルコインを作るのに必要とする暗号方式のハッシング機能を無理に実行させるため、普段より多くの電力を消費したり、非常に高温になったりすることが普通だ。

トレンドマイクロが発見したふたつのアプリケーションは、機器が充電されているときだけコインをマイニングするようプログラムされていた。この設定はバッテリーの急速な消耗を防ぐものの、機器が高温になるのと、大量の処理能力を消費するのを防ぐことにはならない。

「スマートフォンには、効果的なマイニングツールとして機能するだけの性能はない。充電に時間がかかったり、機器が非常に高温になったりして、マイニングが行われていることにユーザーはすぐに気がつくだろう」と、マイクロトレンドのヴィオ・チャンは述べている。

トレンドマイクロによる今回の発見の1カ月前には、G Data Software社の研究者によって、Android向けのマルウェアがGoogle Playで販売されていることが発覚している。このマルウェアには、スマートフォンを匿名のDogecoinマイニング・プールに取り込んでしまう秘密のコードが含まれている。

引用元: 「秘かに暗号通貨を採掘するアプリ」が100万回以上ダウンロード « WIRED.jp.

【仮想化道場】転換期を迎える2014年のIntelのサーバー向けプロセッサ – クラウド Watch

Xeon Phiの最大の特徴は、コアがPentiumベースのx86プロセッサ+512ビット ベクトル演算機能となっていること。このコアを60個ほど搭載することで、並列コンピューティングにおいて高い性能を実現している。

22nmプロセスで製造されたXeon Phi 7120Pは、1.238GHz動作(ターボモード動作時は1.33GHz)のコアを61個内蔵している。メモリは8GB(DDR5)を搭載し、倍精度浮動小数点演算の性能は約1.2TFlops。

この製品をはじめ、現時点のXeon Phiは別のプロセッサのコプロセッサとして動作するため、PCI Expressのカードで提供されており、Xeon E5などの汎用プロセッサと組み合わせて利用される。

Xeon Phiで面白いのは、x86コアでLinux OSを独立して動かし、並列コンピューティング用のプログラムを処理できることだろう。このように、Xeon Phi自体がOSを持ち動作することは、NVIDIAやAMDのGPGPUとは大きく異なっている。

また、コアがx86アーキテクチャを利用しているため、GPGPUのように独自のプログラミング言語でプログラムを作成するのではなく、現在利用しているx86プログラミングがそのまま利用できるという点も、大きなメリットである。

ただし、どんなx86プログラムでもXeon Phiで動かせば性能が上がる、というモノではない。やはり並列コンピューティング用に開発されたプログラムをXeon Phi用にリコンパイルする必要がある。実際Intelでは、既存のXeon用のC/C++プログラミング用のコンパイラをXeon Phiに対応させて、Xeon Phi環境で最も効率が高くなるようにしている。

引用元: 【仮想化道場】転換期を迎える2014年のIntelのサーバー向けプロセッサ – クラウド Watch.

【後藤弘茂のWeekly海外ニュース】APUをデータセンターにもたらすAMDの新サーバー戦略 – PC Watch

AMDがサーバーの変革の波に乗ろうとしているように、Intelもサーバーでの変革を進めている。IntelのラインナップでAMDのAPUに当たるのは次期MIC(マイク:Many Integrated Core)アーキテクチャの「Knights Landing」、AMDのARM CPUコアサーバーに当たるのは「Avoton(アヴォトン)」以降のAtom系CPUコアのサーバーCPU。AMD戦略との違いは明瞭で、Intelがx86を拡張した高スループットコアを使うのに対して、AMDはGPUコア。Intelがx86命令セットのスモールCPUコアを使うのに対して、AMDはARMコアとなる。

以前は、AMDはx86の世界でIntelに対抗しようとしていた。しかし、現在のAMDは明らかに戦略を転換している。対Intel軸の側の技術に寄っており、Intel以外のチップ業界で盛り上がっている技術に乗る、あるいは先導する方針を採っている。

NVIDIAも、目立たないながらもCUDAフレームワークを着実に進化させている。NVIDIAの次のステップは当然CPUコアの統合で、64-bit ARMv8のDenver(デンバー)コアを統合してAMD用語でのAPU化を実現する。

引用元: 【後藤弘茂のWeekly海外ニュース】APUをデータセンターにもたらすAMDの新サーバー戦略 – PC Watch.

Nutanix delivers a GPU platform that pays for itself – in Bitcoins | Nutanix

The first step is to establish the normal working hours of the GPU users. For this example, let’s assume 9 am to 5 pm. At 5 pm, a customer script checks the workload of the Nutanix GPU nodes to verify that they are going idle.

The Bitcoin/Litecoin Mining virtual appliance (Linux OS + something like BFGMiner) starts up – using the installed mining card along with the PCI passthrough feature of VMware vSphere to deliver the capability to the mining virtual machine.

The Mining virtual appliance runs for approximately 16 hours and then powers off before workers come back into the office. Tying into the Nutanix Prism API makes it possible to build a, “While you were away” dashboard that shows how many bitcoins were generated, the current trading value (from other APIs), and the generated total YTD. The possibilities with the Nutanix platform are endless.

引用元: Nutanix delivers a GPU platform that pays for itself – in Bitcoins | Nutanix.

東工大の松岡教授に聞いた「TSUBAME3.0」、そしてエクサへの道(前編) | マイナビニュース

TSUBAME-KFCに使われているGreen Revolution Coolingの油はSCの展示で筆者も触ったことがあるが、油というよりは水に近いサラサラ感の液体であった。しかし、この油は、日本では引火温度が消防法の規定を満たさず、より粘性の高い油を使う必要がある。粘性が高いと部品のGPUボードなどを交換して引き上げたときに、油が切れず、油まみれになってしまい具合が悪いとのことである。

フロロカーボン系の液体は蒸発してしまうので、このような問題は無いが、コストが高い。ということで、松岡教授は適当な冷却液がないことが問題という。

しかし、このプロジェクトで、問題は低温の冷却水を作ることに多くのエネルギーが必要なことであることが分かったので、TSUBAME3.0では、低温の冷却水を必要としないシステムデザインを考えるとのことであった。

引用元: 東工大の松岡教授に聞いた「TSUBAME3.0」、そしてエクサへの道(前編) | マイナビニュース.

GPUを用いたSSLリバースプロキシの実装について – ゆううきブログ

高スループットを達成するためには数百個(最新世代では1000個以上)のGPUコア(単体コアの性能はCPUに劣る)を活用しなければならないため,並列化が重要

各クライアントから発行されるSSLリクエストは独立しているため,各SSLリクエストは並列に処理可能.したがって,GPUに複数のリクエスト分の暗号処理をまとめてつっこむ.

低負荷時(同時接続数が少ない)ときはGPUに渡すタスク量が小さすぎるためCPUのみのほうがスループットが高く,逆に高負荷時にGPUに渡すタスク量が多すぎてスループットがでないということがある.よって,CPU1コアのほうがスループットが高くなるような負荷であれば,CPUに任せる.一方,GPUに渡すタスク量が多過ぎないように,適当なところでGPUに渡すタスク量に上限を設ける.

引用元: GPUを用いたSSLリバースプロキシの実装について – ゆううきブログ.

「PS4は軽いビジネスモデル」──ソニーのゲーム事業、ローンチ初年度も黒字確保へ – ITmedia ニュース

PS4ではCPUは米AMD製のx86-64プロセッサ、GPUはRadeonベースとなるなど、PCに近いアーキテクチャを採用している。「チップセットなどは、ソニーの技術や知恵を盛り込んでいるが既存のものを使い、製造はファウンドリー(半導体製造会社)などが技術を持っているので自らプロセスなどを開発する必要もなく、投資も少なく済む。PS4は軽いビジネスモデルだ」(加藤CFO)という。一方、ソフト開発やマーケティングにはそれなりのコストをかける考えだ。

引用元: 「PS4は軽いビジネスモデル」──ソニーのゲーム事業、ローンチ初年度も黒字確保へ – ITmedia ニュース.

【後藤弘茂のWeekly海外ニュース】CPUとGPUのメモリ空間を統一するAMDの「hUMA」アーキテクチャ

現在のAPUは、物理的なメモリは単一だが、CPUとGPUで個別のメモリアドレス空間を持っている。UMA(Uniform Memory Access)システムでは、全てのプロセッシングコアがシングル単一のメモリアドレス空間を共有するべきだが、そうなっていないとAMDは指摘する。その原因は、GPUコンピュートが導入された時に、ディスクリートGPUによって「Non-Uniform Memory Access (NUMA)」が持ち込まれたからだと言う。個別のメモリ空間に分断されたNUMAによって、ヘテロジニアスコンピューティングでは複雑なプログラミングを強いられているというのがAMDの視点だ。異なるメモリ空間の間で、煩雑なデータコピーと同期、それにアドレス変換が必要になる。

引用元: 【後藤弘茂のWeekly海外ニュース】CPUとGPUのメモリ空間を統一するAMDの「hUMA」アーキテクチャ.

【後藤弘茂のWeekly海外ニュース】CPUとGPUのメモリ空間を統一するAMDの「hUMA」アーキテクチャ

ところがhUMAでは、GPUがCPUと同様にポインタを使うことができる。そのため、CPUとGPUの間の連携は極めてシンプルになる。hUMAではCPUがGPUに単純にポインタを渡すだけで、GPUがそのままCPUのデータ構造にアクセスできるようになる。GPUはそのままデータを更新する。CPUはその結果を、直接読むことができる。複雑なデータ構造の場合も、GPUが組み込まれた構造リンクを追うことができるので、データ構造の転換も一切必要がない。

引用元: 【後藤弘茂のWeekly海外ニュース】CPUとGPUのメモリ空間を統一するAMDの「hUMA」アーキテクチャ.