distil-small.en, Inovasi AI Ukuran Mungil untuk Pengenalan Suara Berbasis Edge

https://www.facebook.com/pibitek

December 16, 2023 Yesi

TL;DR

Tim Hugging Face ciptakan distil-small.en, AI pengenalan suara perangkat edge nan efisien.
Dengan 166 juta parameter, model ini ideal untuk IoT dan aplikasi seluler.
Meskipun hanya mendukung bahasa Inggris, tapi ini langkah penting menuju pengenalan suara yang luas, terutama untuk perangkat kecil.

photo from: aibusiness

pibitek.biz - Tim insinyur AI dari platform AI sumber terbuka, Hugging Face, telah mengembangkan sistem pengenalan suara yang dirancang untuk bekerja dalam lingkungan memori rendah. Dengan hanya 166 juta parameter, distil-small.en jadi enam kali lebih cepat daripada Whisper v2 milik OpenAI, meskipun ukurannya 49% lebih kecil.

Sistem kecil ini merupakan versi kompak dari model Whisper, dirancang untuk digunakan di perangkat dengan keterbatasan ruang dan daya pemrosesan. Dalam implementasinya, distil-small.en dapat digunakan untuk menggerakkan kontrol suara pada perangkat Internet of Things (IoT), seperti pengontrol rumah pintar atau bahkan mobil dengan speaker pintar.

Berkat ukurannya, sistem ini bahkan dapat diintegrasikan ke dalam aplikasi seluler untuk pengenalan suara real-time, mungkin untuk aplikasi terjemahan atau asisten yang diaktifkan suara. Sanchit Gandhi, seorang insinyur penelitian machine learning di Hugging Face, menyatakan di Twitter bahwa lapisan decoder tambahan pada distil-small.en membantu mempertahankan akurasi transkripsi model pada ukuran yang sangat kecil.

Dalam hal kinerja, distil-small.en mencapai skor yang lebih tinggi dalam lingkungan latensi rendah dibandingkan dengan Whisper asli dan versi distilasi lainnya. Namun, untuk lingkungan dengan lebih banyak memori, tim Hugging Face merekomendasikan penggunaan distil-medium.en atau distil-large-v2 karena keduanya lebih cepat dan mencapai hasil Word Error Rate (WER) yang lebih baik.

Dukungan Bahasa Lain

Saat ini, distil-small.en hanya tersedia untuk pengenalan suara dalam bahasa Inggris. Tim dari Hugging Face mengatakan bahwa mereka sedang bekerja untuk menerapkannya pada bahasa-bahasa lain. Hugging Face memamerkan model ini digunakan untuk transkripsi file audio pendek dan panjang, dengan contoh inferensi yang dapat didengar di halaman distil-small.en di situs Hugging Face.

Pengenalan Suara di Ujung Jari.

Dengan ukurannya yang kecil dan kinerjanya yang mengesankan, distil-small.en membuka pintu bagi aplikasi pengenalan suara real-time di berbagai perangkat. Mulai dari pengontrol rumah pintar, mobil dengan speaker pintar, hingga aplikasi seluler untuk terjemahan suara atau asisten virtual. Meskipun saat ini yang sudah tersedia hanya pengenalan suara dalam bahasa Inggris, namun upaya sedang dilakukan untuk mengaplikasikan teknologi ini pada bahasa-bahasa lain. Inovasi ini menandai langkah penting menuju pengenalan suara yang efisien dan dapat diakses di berbagai platform, terutama perangkat genggam dan kecil.

Berkat ChatGPT, Buku yang Ditulis oleh AI Melejit di AmazonBerkat ChatGPT, Buku yang Ditulis oleh AI Melejit di Amazon

Buku elektronik AI di Amazon mengubah industri penerbitan dengan konten tak terkalahkan. Penerbit dapat berinovasi dengan buku hibrida, gabungan AI efisien dan sentuhan manusia. Fenomena ini menuntut penulis untuk bersaing dan berkolaborasi dengan teknologi {11/11 Amazon}

Elon Musk Dikecam Anonymous di Media Sosial X - picture owner: rfxlyibhtn - pibitek.biz - Pemerintah

Web • Elon Musk Dikecam Anonymous di Media Sosial XWeb • Elon Musk Dikecam Anonymous di Media Sosial X

Elon Musk mendapat kecaman dari Anonymous karena pernyataan kontroversialnya di media sosial. Anonymous menyindir Musk, menyebutnya intelektual miskin meskipun kaya materi.

HWiNFO Mendukung Perangkat Keras Intel Generasi Mendatang - image owner: extremetech - pibitek.biz - Hardware

Hardware • HWiNFO Mendukung Perangkat Keras Intel Generasi MendatangHardware • HWiNFO Mendukung Perangkat Keras Intel Generasi Mendatang

HWiNFO siap dukung GPU Intel terbaru. GPU Intel terbagi jadi Battlemage, Celestial, dan Druid. GPU Intel akan terus berubah sampai tahun 2027.

Tesla Model Y Baru, Siap Hadapi Persaingan China - picture from: teslarati - pibitek.biz - Amerika Serikat

Tesla Model Y Baru, Siap Hadapi Persaingan ChinaTesla Model Y Baru, Siap Hadapi Persaingan China

Model 3 — Tesla Giga Shanghai akan meluncurkan Model Y terbaru pada tahun ini (tahun 2024) untuk menghadapi persaingan yang semakin ketat di pasar mobil listrik China. Menurut sumber yang dekat dengan perusahaan, pabrik Tesla di Shanghai sudah bersiap untuk memproduksi Model Y versi 2024. Produksi massal diharapkan dimulai pada pertengahan tahun 2024. Model

AudioCraft: AI Pembuat Musik dan Suara dari Imajinasi Terdalam Anda - picture origin: gigadgets - pibitek.biz - AI Generatif

AudioCraft: AI Pembuat Musik dan Suara dari Imajinasi Terdalam Anda – SuaraAudioCraft: AI Pembuat Musik dan Suara dari Imajinasi Terdalam Anda – Suara

AudioCraft oleh Meta adalah rangkaian AI pembuat musik dan suara. Transformer-XL dapat menghasilkan kualitas audio sebanding dengan manusia. Meta berharap AudioCraft

IBM Hasilkan Chip AI Analog untuk Deep Learning - picture origin: artificialintelligence-news - pibitek.biz - Aplikasi

IBM Hasilkan Chip AI Analog untuk Deep Learning – EfisiensiIBM Hasilkan Chip AI Analog untuk Deep Learning – Efisiensi

IBM Research telah mengungkapkan chip AI analog yang menunjukkan efisiensi dan akurasi luar biasa dalam melakukan komputasi kompleks untuk jaringan saraf dalam (DNN). Terobosan ini, yang dipublikasikan dalam sebuah makalah terbaru di Nature Electronics, menandakan langkah signifikan menuju pencapaian komputasi AI berkinerja tinggi sambil secara substansial menghemat energi. Pendekatan tradisional dalam

Presale Pushd (PUSHD) Meledak Bareng Bitcoin dan Ethereum - picture from: quoteinspector - pibitek.biz - Risiko

Pangsa Pasar — Presale Pushd (PUSHD) Meledak Bareng Bitcoin dan EthereumPangsa Pasar — Presale Pushd (PUSHD) Meledak Bareng Bitcoin dan Ethereum

Pushd (PUSHD) adalah proyek kripto baru yang menawarkan solusi pasar yang menarik. Pushd (PUSHD) sedang menjalani presale tahap lima dengan harga 0. 11 dollar AS per token. Para ahli memprediksi bahwa Pushd (PUSHD) bisa memberikan keuntungan hingga 50x - 100x bagi para investor. Pushd (PUSHD) hadir di tengah-tengah fenomena halving

Prototype Mitsubishi Triton Pickup Terlihat di Amerika - photo origin: thedrive - pibitek.biz - Suara

Prototype Mitsubishi Triton Pickup Terlihat di AmerikaPrototype Mitsubishi Triton Pickup Terlihat di Amerika

Gambar • Prototipe truk pikap Mitsubishi Triton terlihat diuji di AS dengan suara kendaraan listrik. Truk ini memiliki detail yang mirip dengan konsep Triton XRT yang direkayasa ulang. Mitsubishi tertarik menjual truk pikap di AS, tetapi Chicken Tax menjadi

Useful Lists

by Dates :	27 Dec 202327 Dec 2023 11 Jan 202411 Jan 2024 13 Jan 202413 Jan 2024
by Authors :	Amalia NopiliantiAmalia Nopilianti Rosita AyuanditaRosita Ayuandita Aries SidhartaAries Sidharta Aldie Richard SetyawantoAldie Richard Setyawanto Nico WillyandataNico Willyandata
by Tags :	#chip#chip #cpu#cpu #risiko#risiko #spacex#spacex #tesla#tesla

distil-small.en, Inovasi AI Ukuran Mungil untuk Pengenalan Suara Berbasis Edge

Related Post

Useful Lists