研究のページ/CUDA
をテンプレートにして作成
[
トップ
] [
新規
| |
検索
|
最終更新
|
ヘルプ
|
ログイン
]
開始行:
#topicpath
** CUDA [#i9611829]
// 素人が書いています!間違っていたらごめんなさい!
Debian(squeeze) に CUDA 5.0 を導入して動かしてみまし...
*** CUDA について [#u7f4bb72]
-- CUDA とは~
NVIDIAが提供するGPU向けのC言語の統合開発環境(cf. [[Wikipe...
~
-- CUDA 用語
|GPU | Graphical Processing Unit | |
|GPGPU | General-Purpose Graphical Processing Unit | 汎用...
| | | |
|SP | Streaming Processor | 演算装置。今では これを CU...
|MP | Multi-Processors | 次のSMと同じ (?) |
|SM | Streaming Multiprocessor | チップ上に置かれた演...
|GPC| Graphics Processing Cluster | SMX 2基をまとめたもの...
| | | |
|Fermi | | ひとつ前の世代 の GPU。SM 中の SP は 32個(16グ...
|Kepler| | 最新の世代 の GPU。 SMは SMX と呼ばれるように...
~
~
-- CUDA でできること
--- 統計パッケージRの計算を速くする。~
cf. http://blogs.yahoo.co.jp/igproj_fusion/9772350.html ~
fastICA も速くなる!?~
cf. http://brainarray.mbni.med.umich.edu/brainarray/rgpgp...
~
--- 流体力学などの数値計算を速くする。~
~
-- CUDA が利用できるGPUs~
--- [[CUDA が使える GPU の一覧>https://developer.nvidia.c...
基本的には、チップが適合していれば使える。~
~
--- GPU の種類~
http://geo.mff.cuni.cz/~hanyk/GUCAS/UoM-Using-PGI.pdf に...
・GeForce : デスクトップ用 ~
・Quadro : プロのグラフィックス~
・TESLA : 計算機用~
~
-- CUDA に似たプロジェクト~
--- OpenCL~
私の理解では、CUDAと同様にコンパイラを含んだ SDK(ソフトウ...
CUDA が nVIDIA の GPU に特化しているのに対して、OpenCL は...
実際の SDK には様々な種類があるらしい。~
(cf. [[Wikipedia>http://ja.wikipedia.org/wiki/OpenCL]])~
~
--- OpenMP~
私の理解では、コンパイラとは別にライブラリとして整備した...
プログラム中に「ディレクティブ」を挿入することで、並列環...
(cf. [[Wikipedia>http://ja.wikipedia.org/wiki/OpenMP]])~
~
--- MPI(Message Passing Interface)~
OpenMP と同様にライブラリとして並列処理を整備したもの。個...
具体的なライブラリは、[[Open MPI>http://www.open-mpi.org/...
(cf. [[Wikipedia>http://ja.wikipedia.org/wiki/Message_Pas...
~
*** ハードウエアの装着 [#d1cc3287]
-- 購入したもの~
&amazon(B00B1AW7O0);([[価格COM>http://kakaku.com/item/K00...
&amazon(B00B1AW7O0,image);~
~
--- 情報~
| ベースとなるコア| GK106 |
| Total amount of global memory: |2048 M...
| ( 5) Multiprocessors x (192) CUDA Cores/MP: |960 CU...
| GPU Clock rate: |1072 M...
| Memory Clock rate: |3004 M...
| Memory Bus Width: |192-bit|
~
~
--- 理論性能~
cf. [[Nordic Hardware>http://www.nordichardware.com/graph...
|・単精度 | 1クロックで CUDA コアあたり 最大2演算できる(...
|・倍精度 | 1クロックで SMX あたり最大16演算できる(ただし...
~
-- 取り付け時の注意
+++ PCIExpress x16 のポートの他に、もう一枚分のスペースを...
+++ マザーボードに挿した上で、別途、グラフィックボードに...
+++ %% 起動時に BIOS を設定し、マザーボードのグラフィック...
%% 取り付けたグラフィックカードを利用しないようにする。%%~
COLOR(RED): むしろ、グラフィックカードとして使用しないと...
~
*** 開発環境(ソフトウエア)の整備 [#u20e018c]
-- 参考URL~
--- [[Masteries>http://blog.papix.net/entry/2012/11/06/18...
--- [[ぬうぱんの備忘録とか>http://d.hatena.ne.jp/NU_Pan/2...
これを見ると、CUDA 5 (Ubuntu11.10用) は現行の Debian では...
そこで、Ubuntu10.04用を試すことにする。~
~
-- ダウンロード~
--- ドライバ~
http://www.nvidia.co.jp/Download/index.aspx?lang=jp から...
70MB弱。~
~
--- 本体 (CUDA 5.0)~
https://developer.nvidia.com/cuda-downloads から Ubuntu 1...
670MB もあるので、ダウンロード中は別の仕事をする。~
~
--- Debian パッケージ~
次のようなパッケージを導入した。~
libglut3-dev, libXi-dev, libXmu-dev~
~
-- ドライバの導入スクリプトの実行~
--- root で bash NVIDIA-Linux-x86_64-310.32.run
--- DKMS(Dynamic Kernel Module Support)を Yes にするとう...
~
-- CUDA本体の導入スクリプトの実行~
--- root で bash cuda_5.0.35_linux_64_ubuntu10.04-1.run
--- 指示に従って処理する。~
・グラフィックドライバは導入しないつもりだった。しかし、...
→ sudo cuda_5.0.35_linux_64_ubuntu10.04-1.run -silent...
→ そこで前述のドライバを別途導入した。~
~
-- 確認~
サンプルプログラムのページで make してうまくいけばよい。~
ちなみに、サンプルプログラム matrixMulCUBLAS を実行すると...
また、サンプルプログラムで描画するものは、むしろ nVIDIA G...
終了行:
#topicpath
** CUDA [#i9611829]
// 素人が書いています!間違っていたらごめんなさい!
Debian(squeeze) に CUDA 5.0 を導入して動かしてみまし...
*** CUDA について [#u7f4bb72]
-- CUDA とは~
NVIDIAが提供するGPU向けのC言語の統合開発環境(cf. [[Wikipe...
~
-- CUDA 用語
|GPU | Graphical Processing Unit | |
|GPGPU | General-Purpose Graphical Processing Unit | 汎用...
| | | |
|SP | Streaming Processor | 演算装置。今では これを CU...
|MP | Multi-Processors | 次のSMと同じ (?) |
|SM | Streaming Multiprocessor | チップ上に置かれた演...
|GPC| Graphics Processing Cluster | SMX 2基をまとめたもの...
| | | |
|Fermi | | ひとつ前の世代 の GPU。SM 中の SP は 32個(16グ...
|Kepler| | 最新の世代 の GPU。 SMは SMX と呼ばれるように...
~
~
-- CUDA でできること
--- 統計パッケージRの計算を速くする。~
cf. http://blogs.yahoo.co.jp/igproj_fusion/9772350.html ~
fastICA も速くなる!?~
cf. http://brainarray.mbni.med.umich.edu/brainarray/rgpgp...
~
--- 流体力学などの数値計算を速くする。~
~
-- CUDA が利用できるGPUs~
--- [[CUDA が使える GPU の一覧>https://developer.nvidia.c...
基本的には、チップが適合していれば使える。~
~
--- GPU の種類~
http://geo.mff.cuni.cz/~hanyk/GUCAS/UoM-Using-PGI.pdf に...
・GeForce : デスクトップ用 ~
・Quadro : プロのグラフィックス~
・TESLA : 計算機用~
~
-- CUDA に似たプロジェクト~
--- OpenCL~
私の理解では、CUDAと同様にコンパイラを含んだ SDK(ソフトウ...
CUDA が nVIDIA の GPU に特化しているのに対して、OpenCL は...
実際の SDK には様々な種類があるらしい。~
(cf. [[Wikipedia>http://ja.wikipedia.org/wiki/OpenCL]])~
~
--- OpenMP~
私の理解では、コンパイラとは別にライブラリとして整備した...
プログラム中に「ディレクティブ」を挿入することで、並列環...
(cf. [[Wikipedia>http://ja.wikipedia.org/wiki/OpenMP]])~
~
--- MPI(Message Passing Interface)~
OpenMP と同様にライブラリとして並列処理を整備したもの。個...
具体的なライブラリは、[[Open MPI>http://www.open-mpi.org/...
(cf. [[Wikipedia>http://ja.wikipedia.org/wiki/Message_Pas...
~
*** ハードウエアの装着 [#d1cc3287]
-- 購入したもの~
&amazon(B00B1AW7O0);([[価格COM>http://kakaku.com/item/K00...
&amazon(B00B1AW7O0,image);~
~
--- 情報~
| ベースとなるコア| GK106 |
| Total amount of global memory: |2048 M...
| ( 5) Multiprocessors x (192) CUDA Cores/MP: |960 CU...
| GPU Clock rate: |1072 M...
| Memory Clock rate: |3004 M...
| Memory Bus Width: |192-bit|
~
~
--- 理論性能~
cf. [[Nordic Hardware>http://www.nordichardware.com/graph...
|・単精度 | 1クロックで CUDA コアあたり 最大2演算できる(...
|・倍精度 | 1クロックで SMX あたり最大16演算できる(ただし...
~
-- 取り付け時の注意
+++ PCIExpress x16 のポートの他に、もう一枚分のスペースを...
+++ マザーボードに挿した上で、別途、グラフィックボードに...
+++ %% 起動時に BIOS を設定し、マザーボードのグラフィック...
%% 取り付けたグラフィックカードを利用しないようにする。%%~
COLOR(RED): むしろ、グラフィックカードとして使用しないと...
~
*** 開発環境(ソフトウエア)の整備 [#u20e018c]
-- 参考URL~
--- [[Masteries>http://blog.papix.net/entry/2012/11/06/18...
--- [[ぬうぱんの備忘録とか>http://d.hatena.ne.jp/NU_Pan/2...
これを見ると、CUDA 5 (Ubuntu11.10用) は現行の Debian では...
そこで、Ubuntu10.04用を試すことにする。~
~
-- ダウンロード~
--- ドライバ~
http://www.nvidia.co.jp/Download/index.aspx?lang=jp から...
70MB弱。~
~
--- 本体 (CUDA 5.0)~
https://developer.nvidia.com/cuda-downloads から Ubuntu 1...
670MB もあるので、ダウンロード中は別の仕事をする。~
~
--- Debian パッケージ~
次のようなパッケージを導入した。~
libglut3-dev, libXi-dev, libXmu-dev~
~
-- ドライバの導入スクリプトの実行~
--- root で bash NVIDIA-Linux-x86_64-310.32.run
--- DKMS(Dynamic Kernel Module Support)を Yes にするとう...
~
-- CUDA本体の導入スクリプトの実行~
--- root で bash cuda_5.0.35_linux_64_ubuntu10.04-1.run
--- 指示に従って処理する。~
・グラフィックドライバは導入しないつもりだった。しかし、...
→ sudo cuda_5.0.35_linux_64_ubuntu10.04-1.run -silent...
→ そこで前述のドライバを別途導入した。~
~
-- 確認~
サンプルプログラムのページで make してうまくいけばよい。~
ちなみに、サンプルプログラム matrixMulCUBLAS を実行すると...
また、サンプルプログラムで描画するものは、むしろ nVIDIA G...
ページ名: