NVIDIA Announces PCI Express Tesla P100: Shipping In Q4’16

Monday, June 20th, 2016 - GPUs, Teknologi

NVIDIA Announces PCI Express Tesla P100: Shipping In Q4’16

Advertisement

di awal pekan ini di Frankfurt, Jerman tahunan superkomputer Konferensi internasional, yang dikenal Bagaikan ISC. Disorientasi satu dari dua konferensi besar hacks untuk tahun ini, dan umumnya digunakan biaya dukungan tak langsung Bagaikan latar belakang untuk prosesor iklan-kinerja tinggi, dan tahun ini tak berbeda. Memulai hal-hal tahun ini Yaitu NVIDIA, yang membawanya di dirinya untuk menunjukkan mengumumkan versi PCI Express akselerator Tesla P100.

kami pertama kali diperkenalkan ke Tesla P100 di bulan April tahun ini , saat mengumumkan NVIDIA di GPU Technology Conference 2016 atas dasar arsitektur Pascal baru NVIDIA, dan di karenakan gp100 GPU 16nm, Tesla P100 Yaitu langkah bahkan serangkaian besar Tesla K / M dan 28 nm setiap Kepler / Maxwell GPU. Selain Jadi GPU Paling Besar masih, P100 menawarkan sejumlah fitur baru termasuk cache yang lebih besar, switch konteks proaktif, tingkat pendidikan, kecepatan ganda (dikemas) akun FP16.

versi awal dari P100 diumumkan di di versi tertinggi kinerja NVIDIA, 300W papan memakai konektor mezzanine baru dan NVIDIA, pengiriman dengan 56 dari 60 SMS diaktifkan. Mosul mezzanine menandai Embarkasi radikal dari desain kartu NVIDIA Tesla tradisional, akan tetapi juga mereka yang diperlukan untuk memfasilitasi kecepatan tinggi bus NVLink point-to-point Nvidia. Tapi tak wajib setiap pelanggan Fitur NVLink atau ingin membangun sistem Eksklusif untuk konektor mezzanine, dan ini Yaitu di mana copy kartu PCIe fleshes keluar Tesla lineup P100.

keluarga NVIDIA Tesla dibandingkan dengan spesifikasi
Tesla P100
(mezzanine)
Tesla P100
(16GB)
Tesla P100
(16GB)
Tesla M40
prosesor Streaming 3584 3584 3584 3072
jam dasar 1328MHz?? 948MHz
Batch hour (s) 1480MHz 1300MHz 1300MHz 1114MHz
memory clock 1.4Gbps HBM2 1.4Gbps HBM2 1.4Gbps HBM2 6Gbps GDDR5
lebar bus memori 4096-bit 4096-bit 3072-bit 384. bit
bandwidth memory 720GB / sec 720GB / sec 540GB / sec 288GB / s
VRAM 16GB 16GB 12GB 12GB
setengah-res 21,2 TFLOPS 18,7 TFLOPS 18,7 TFLOPS 6,8 TFLOPS
presisi tunggal 10,6 TFLOPS 9,3 TFLOPS 9,3 TFLOPS 6,8 TFLOPS
ganda presisi 5.3 TFLOPS
(1/2 rate)
4,7 TFLOPS
(1/2 rate)
4,7 TFLOPS
(1/2 rate)
213 GFLOPS
(1/32 rate)
GPU gp100
(610mm2)
gp100
(610mm2)
gp100
(610mm2)
GM200
jumlah transistor 15.3B 15.3B 15.3B 8B
TDP 300W 250W 250W 250W
faktor bentuk mezzanine PCIe PCIe PCIe
pendinginan N / A negatif negatif negatif
proses manufaktur TSMC 16nm FinFET dan TSMC 16nm FinFET dan TSMC 16nm FinFET dan TSMC 28nm
arsitektur Pascal Pascal Pascal Maxwell 2

NVIDIA akan pengiriman dua versi PCIe Tesla P100. pembentukan PCIe lebih tinggi-end downclocked di dasarnya Yaitu salinan dari P100 asli untuk kartu PCIe. di hal ini kita melihat yang Serupa 6056 antara SMS diaktifkan hanya dengan jam batch 1.3GHz bukan 1.48GHz dan P100 asli. Hal ini menempatkan produktivitas teoritis di 9,3 TFLOPS untuk FP32 dan 4,7 TFLOPS untuk FP64, dibandingkan 10,6 TFLOPS dan 5,3 TFLOPS berturut-turut untuk P100 asli. Perubahan clockspeed menyerap bawah kartu PCIe TDP ini. Sementara kartu mezzanine Yaitu 300W, kartu PCIe Leahy 250W, yang merupakan TDP Serupa dengan Tesla kartu generasi terakhir di PCIe. Pengiriman dengan TDP yang Serupa berarti bahwa kartu ini Bisa digunakan untuk penurunan PCIe di penggantian kartu lama Tesla, di karenakan mereka mempunyai kekuatan dan pendinginan persyaratan yang Serupa.

di di yang Serupa di Hepotenusa memori hal, Mahkamah diaktifkan kapal kartu dengan akhir 16GB penuh HBM2. Permintaan Kluxpedes tak ada di sini Serupa sekali, Jadi masih di pembentukan 1.4Gbps HBM2 paket quad, yang memungkinkan 720 GB / detik untuk bandwidth (dengan dan tanpa ECC Serupa).

Ini poin terakhir ini bahwa versi ujung bawah P100 PCIe Tesla lanjut perubahan hal. Low-end kapal kartu dengan kecepatan GPU yang Serupa akun yang luas Kluxpedes, akan tetapi mengurangi jumlah memori dan bandwidth memory sebesar 25%. Hal ini membawa kapasitas total memori ke 12GB, dan total bandwidth memori dan hingga 540GB / sec. NVIDIA sebelumnya ditawarkan beberapa lapisan / tag harga high-end Tesla – meskipun biasanya di bawah nomor model yang berbeda untuk membuatnya lebih mudah untuk membedakan – dan Seusai kartu PCIe untuk beberapa tak biasa untuk perusahaan

tak Menyebut dengan cara eksplisit perusahaan (tapi jelas dari spesifikasi) yang ini seharusnya Jadi bagian Ekonomis untuk gp100. Mengingat tingkat integrasi yang diperlukan dari memori HBM2, gp100 dan paket wajib dirakit dengan cara lengkap dengan intervenor dan HBM2 awal. Ini berarti bahwa setiap masalah dengan paket permanen, dan NVIDIA bagus melemparkan atau menyimpan paket. kartu PCIe untuk tingkat terendah memberi mereka pilihan untuk yang terakhir. bila paket keluar dengan HBM2 tumpukan kerusakan, Link intervenor atau memory controller HBM2, maka NVIDIA Bisa menonaktifkan HBM2 tumpukan buruk dan menjualnya bukannya melemparkan Serupa sekali.

Setiap kartu ini akan ditargetkan di pelanggan yang bagus tak wajib NVLink, atau butuh pengurangan kartu promosi untuk kartu Tesla di ini. Dan kurangnya NVLink mempengaruhi kinerja hingga batas Eksklusif di sistem multi-card, akan tetapi akan sangat bergantung di beban kerja. Untuk beban kerja yang tak memerlukan banyak komunikasi berkecepatan tinggi antara GPU, maka efeknya akan minimal, dan itu akan membuat salinan PCIe bagus, dan mendukung tradisional untuk klien-klien ini.

bersama dengan merilis spesifikasi NVIDIA Tesla mengumumkan bahwa PCIe P100 akan tersedia di Q4 tahun ini. Mengingat hardware tambahan yang diperlukan untuk mengakomodasi mezzanine salinan asli dari P100, dan fakta bahwa NVIDIA memakai dewan ini untuk dirinya sendiri DGX-1 kotak server, dan saya pikir kita akan melihat bahwa PCIe Tesla P100 P100 akan tersedia di sistem non-NVIDIA pertama. Apakah dicatat, bagaimanapun, bahwa harga untuk kartu PCIe M belum diumumkan.

Akhirnya, dan dimakamkan di Deklarasi P100 PCIe Tesla, NVIDIA juga menegaskan bahwa biz Daant raksasa proyek upgrade di jadwal untuk akhir tahun ini. Ini akan Jadi Swiss National Supercomputing Center untuk meng-upgrade mundur, untuk menggantikan 4500 kartu Tesla K20X raksasa dengan kartu PCIe untuk Tesla P100. Ini akan Jadi, untuk pengetahuan kita, superkomputer pertama berdasarkan Pascal P100 untuk dengan cara online Seusai kalian meng-upgrade

pembaruan perangkat lunak: 4 digit, cnDNN 5.1, dan Industri Gaza

bersama dengan PCIe Pembertitahuan tesla P100 – akan tetapi tak relevan justru di karenakan mereka – NVIDIA juga mengumumkan beberapa pembaruan perangkat lunak komponen di SDK Berguru, dan koleksi perusahaan dari berbagai perpustakaan, program dan alat-alat

set untuk mencapai di waktu dekat, bagus cuDNN dan DIGIT menerima upgrade. Versi 5.1 dari cuDNN Yaitu minor update untuk membagikan perbaikan di kinerja gaya jaringan ResNet. di di yang Serupa DIGIT versi 4 Yaitu yang paling penting, dengan NVIDIA menambahkan fungsi deteksi / sistem pengenalan untuk objek pelatihan jaringan netral mereka.

4 digit juga Eksklusif dirancang untuk pergi dengan dan NVIDIA mengungkapkan heuristik GPU sebelumnya mesin (GIE), satu set program yang telah diumumkan lagi di GTC 2016. meluas NVIDIA upaya mereka untuk hingga ke di / saraf Berguru jaringan, karir keberatan DIGIT deteksi “keselarasan dengan NVIDA upaya lain, yang memungkinkan pengembang untuk memakai sebenarnya ( menjalankan inferensi dengan) jaringan DIGIT bertenaga kegugupan mereka sendiri. memakai kasus untuk PX2 mesin dan Dewan Jetson TX1 berakar sebagian besar di hardware semi-otonom di dunia nyata, sementara mengharapkan deteksi obyek NVIDIA Jadi masalah besar untuk pelanggan Tesla M4 yang . analisis video



Source link : NVIDIA Announces PCI Express Tesla P100: Shipping In Q4’16

Incoming search terms:

Advertisement

Pictures gallery of NVIDIA Announces PCI Express Tesla P100: Shipping In Q4’16

NVIDIA Announces PCI Express Tesla P100: Shipping In Q4’16 | admin | 4.5