Pada kapasitas tertingginya, V4 DeepSeek ‘mendefinisikan ulang kecanggihan model terbuka’, menurut perusahaan.
Kesayangan AI Tiongkok, DeepSeek, telah meluncurkan model bahasa besar (LLM) V4 yang telah lama ditunggu-tunggu, seiring spekulasi seputar kemungkinan putaran pendanaan pertama yang beredar.
Peluncuran open-source terbaru ini terjadi lebih dari setahun setelah perusahaan rintisan tersebut merilis R1, yang efektivitas biaya dan kinerjanya membuat para pemimpin Silicon Valley kebingungan, sehingga memicu tuduhan pencurian. R1 dilatih menggunakan chip Nvidia berkapasitas lebih rendah.
Seri V4 hadir dalam dua versi, versi ‘Pro’ dengan 49 miliar parameter yang diaktifkan dan versi ‘Flash’ dengan 13 miliar parameter yang diaktifkan, keduanya mendukung panjang konteks 1 juta token.
Pada kapasitas maksimumnya, mode V4-Pro-Max “mendefinisikan ulang kecanggihan model terbuka, mengungguli pendahulunya dalam tugas-tugas inti”, kata DeepSeek.
Mode ini telah “secara signifikan menutup kesenjangan” dengan Google Gemini 3.1-Pro, model terdepan dalam evaluasi berbasis pengetahuan, menurut perusahaan, sekaligus melampaui GPT-5.2 dan Gemini-3.0-Pro OpenAI dalam “benchmark penalaran standar”.
Dalam tugas agenik, V4-Pro-Max DeepSeek setara dengan model sumber terbuka terkemuka, seperti Kimi-K2.6 dan GLM-5.1, tetapi sedikit lebih buruk daripada model tertutup perbatasan, katanya.
Evaluasi internalnya mengungkapkan bahwa versi Pro-Max mengungguli Claude Sonnet 4.5 dari Anthropic dan mendekati level Opus 4.5. Huawei mengatakan bahwa supernode Ascend yang berbasis pada chip AI Ascend 950 akan mendukung versi V4.
OpenAI membuat tuduhan baru terhadap DeepSeek baru-baru ini pada bulan Februari, dengan menyebut teknik distilasi perusahaan tersebut sebagai bagian dari “upaya berkelanjutan untuk memanfaatkan kemampuan yang dikembangkan oleh OpenAI dan laboratorium perbatasan AS lainnya”.
Sementara itu, pemerintah AS kemarin (23 April) menyatakan akan bekerja sama dengan perusahaan AI untuk melawan “kampanye skala industri” yang dilakukan aktor asing yang mencoba mencuri teknologinya.
Raksasa teknologi Tiongkok Tencent dan Alibaba dilaporkan sedang dalam pembicaraan untuk bergabung dengan putaran pendanaan pertama DeepSeek. Sebuah sumber mengatakan kepada Bloomberg bahwa patokan penilaiannya adalah sekitar $40 miliar. Publikasi tersebut lebih lanjut melaporkan bahwa Tencent telah mengusulkan 20 persen saham di perusahaan tersebut.
Orang-orang sezaman dengan DeepSeek di Tiongkok telah meluncurkan model AI mereka sendiri dalam beberapa bulan terakhir, berharap untuk menjadi yang terdepan dalam V4, yang dianggap sebagai peluncuran terpenting perusahaan sejak R1, dan V3 pada akhir tahun 2024.
Peluncuran terbaru termasuk Qwen3.5 dari Alibaba; Seedance 2.0 dari ByteDance; GLM-5 milik Zhipu, dilatih seluruhnya menggunakan chip Tiongkok; MiniMax, yang merilis M2.5; dan Moonshot AI yang didukung Alibaba, yang dirilis bersama Kimi K2.5.