Microsoft Rilis Chip AI Pertama, Maia 100, Terobos Dominasi Nvidia



Microsoft Rilis Chip AI Pertama, Maia 100, Terobos Dominasi Nvidia - credit for: techspot - pibitek.biz - Instruksi

credit for: techspot


336-280
TL;DR
  • Microsoft merilis akselerator AI Maia 100 untuk menantang dominasi Nvidia.
  • Maia 100 memberikan performa tinggi dan efisiensi daya yang baik, dengan SDK yang membantu pengembang.
  • Pengembang bisa mudah memindahkan model dari Pytorch dan Triton ke Maia 100.

pibitek.biz -Microsoft kini siap memamerkan keuntungan teknologi chip AI pertama mereka, Maia 100, di konferensi Hot Chips. Desain Maia 100 ini memiliki arsitektur yang memanfaatkan server board, rak, dan software khusus untuk menyediakan solusi yang efektif dan dapat meningkatkan performa untuk beban kerja berbasis AI. Perusahaan merancang akselerator khusus ini untuk menjalankan model OpenAI pada pusat data Azure mereka. Nvidia saat ini memegang sekitar 75-90% pangsa pasar chip AI, namun dominasi ini justru mendorong perusahaan teknologi besar lainnya untuk mengembangkan hardware dan akselerator sendiri untuk mengurangi kekuatan Nvidia.

Kini, Microsoft bergabung dalam persaingan ini dengan merilis Maia 100. Chip ini dibangun dengan proses node 5nm TSMC dan disediakan sebagai bagian 500W, tetapi dapat mendukung TDP hingga 700W. Maia 100 ini dapat memberikan performa tinggi sambil tetap menghemat daya. Akselerator ini juga dilengkapi dengan 64GB HBM2E, yang lebih rendah dari 80GB HBM Nvidia H100 dan 192GB HBM3E Nvidia B200. Microsoft menyebutkan bahwa arsitektur Maia 100 memiliki unit tensor kecepatan tinggi (16xRx16) yang menawarkan pemrosesan cepat untuk pelatihan dan inferensi sambil mendukung beragam jenis data, termasuk jenis data presisi rendah seperti Microsoft MX.

Unit ini dilengkapi dengan mesin superskalar longgar yang dibangun dengan instruksi khusus untuk mendukung jenis data, termasuk FP32 dan BF16, mesin akses memori langsung yang mendukung skema pembagian tensor yang berbeda, dan semafor hardware yang memungkinkan pemrograman asinkron. Akselerator Maia 100 juga menyediakan SDK Maia untuk para pengembang, yang mencakup alat yang memungkinkan pengembang AI dengan cepat memindahkan model yang ditulis sebelumnya di Pytorch dan Triton. SDK Maia mencakup integrasi framework, alat pengembang, dua model pemrograman, dan compiler.

Selain itu, SDK juga memiliki kernel komputasi dan komunikasi yang dioptimalkan, Runtime Maia Host/Device, lapisan abstraksi hardware yang mendukung alokasi memori, peluncuran kernel, penjadwalan, dan pengelolaan perangkat. Microsoft telah memberikan informasi lebih lanjut tentang SDK, protokol jaringan belakang Maia, dan optimisasi dalam postingan blog "Inside Maia 100". Pengembang dapat dengan mudah memindahkan model yang sebelumnya ditulis di Pytorch dan Triton ke dalam SDK Maia.

Hal ini memungkinkan mereka untuk memanfaatkan kelebihan akselerator Maia 100 dalam menjalankan beban kerja berbasis AI. Selain itu, SDK Maia juga menyediakan tools yang dibutuhkan pengembang untuk memaksimalkan kemampuan akselerator. Arsitektur Maia 100 dirancang untuk memberikan performa tinggi dan efisiensi daya yang baik. Dengan memanfaatkan unit tensor kecepatan tinggi dan mesin superskalar longgar, akselerator ini dapat menjalankan beban kerja berbasis AI dengan cepat dan efisien. Selain itu, integrasi framework dan alat pengembang dalam SDK Maia memungkinkan pengembang untuk dengan mudah memindahkan model mereka ke dalam akselerator ini.