Microsoft merilis model AI dasar yang menargetkan perusahaan

Rizal Santoso
Rizal Santoso

Sebagai jurnalis yang berpengalaman lebih dari 15 tahun di media Indonesia, saya berkomitmen untuk menyajikan informasi yang relevan dan otentik agar pembaca lebih dekat dengan keragaman Indonesia.

Microsoft ingin menawarkan ‘pabrik AI dan agen aplikasi terlengkap’.

Microsoft telah merilis tiga model dasar AI baru, yang dibuat secara internal, dalam sebuah langkah yang menempatkan perusahaan tersebut dalam persaingan langsung dengan pesaing AI perusahaan, meskipun mereka memiliki hubungan yang erat dengan OpenAI.

Model dasar baru ini menargetkan tiga modalitas yang paling layak secara komersial: transkripsi, suara, dan gambar. Model-model tersebut telah mendukung produk-produk Microsoft, termasuk Copilot, Bing dan Azure Speech, kata perusahaan itu, dan akan tersedia dalam pratinjau melalui Microsoft Foundry dan MAI Playground.

Dengan ini, Microsoft melanjutkan tujuannya untuk menghadirkan “pabrik AI dan agen aplikasi terlengkap”, katanya.

‘MAI-Transcribe-1’ adalah model pengenalan suara generasi pertama yang diharapkan memberikan “akurasi tingkat perusahaan” dalam 25 bahasa dengan biaya GPU sekitar 50 persen lebih rendah dibandingkan alternatifnya. Skor model ini lebih rendah dari rata-rata ‘tingkat kesalahan kata’ sebesar 4 persen pada tolok ukur akurasi, sementara GPT-Transcribe mencapai 4,2 persen dan Gemini 3.1 Flash mencapai 4,9 persen.

‘MAI-Voice-1’ adalah model penghasil suara yang, menurut Microsoft, dapat menghasilkan audio ekspresif berdurasi 60 detik dalam waktu kurang dari satu detik pada satu GPU.

Bersama-sama, kedua model ini dimaksudkan untuk menghadirkan tumpukan audio AI yang mampu membantu alur kerja pusat panggilan dan layanan berbasis suara lainnya, seperti menyediakan teks langsung, subtitle otomatis, dan mengubah interaksi menjadi data terstruktur untuk penelitian.

Model gambar generasi kedua Microsoft, ‘MAI-Image-2’, diharapkan dapat menawarkan seniman cara untuk “menjelajahi” arah visual yang berbeda. Model ini dibuat melalui “kolaborasi erat” dengan para seniman, kata perusahaan tersebut, dan dimaksudkan untuk membantu perusahaan menciptakan materi branding dan komunikasi.

MAI-Image-2 memulai debutnya di posisi ketiga di papan peringkat Arena.ai untuk keluarga model gambar, dan saat ini berada di peringkat kelima.

Microsoft, yang bernilai $2,7 triliun, telah menawarkan beberapa aplikasi dan layanan platform yang tertanam dalam AI. Copilot Studio-nya memungkinkan pengguna membangun agen, sementara layanan Foundry menawarkan tempat untuk melatih dan menskalakan model.

Sementara itu, integrasi Copilot yang baru-baru ini diumumkan dengan Claude Cowork dari Anthropic dimaksudkan untuk menargetkan meningkatnya permintaan akan agen otonom.

Microsoft mendukung OpenAI dalam putaran pendanaan $122 miliar baru-baru ini bersama dengan Amazon, Nvidia, dan SoftBank. Akhir tahun lalu, perusahaan mengumumkan rencana investasi $10 miliar untuk pusat data di Portugal. Mereka juga mengumumkan tagihan belanja modal triwulanan sebesar $37,5 miliar pada akhir Januari.