Model penalaran matematika AI Deepseek pelopori penalaran dengan verifikasi mandiri
DeepSeekMath-V2 merupakan model penalaran matematika inovatif yang dirancang untuk memastikan tidak hanya jawaban yang benar, tetapi juga bukti yang logis dan dapat diverifikasi.
Hangzhou, China (Xinhua/Indonesia Window) – Perusahaan kecerdasan buatan (artificial intelligent/AI) China, DeepSeek, baru-baru ini meluncurkan DeepSeekMath-V2, model penalaran matematika inovatif yang menetapkan tolok ukur kinerja baru dan mendorong batas-batas pemecahan masalah berbasis AI.
Model baru ini, yang sekarang menjadi sumber terbuka (open-source) di Hugging Face dan GitHub, memperkenalkan kerangka kerja verifikasi mandiri baru yang dirancang untuk memastikan tidak hanya jawaban yang benar, tetapi juga bukti yang logis dan dapat diverifikasi.
Prestasinya mencapai tingkat medali emas pada Olimpiade Matematika Internasional (International Mathematical Olympiad/IMO) 2025 dan Olimpiade Matematika China (Chinese Mathematical Olympiad/CMO) 2024.
Terlebih, model ini juga berhasil memperoleh skor 118 dari 120 poin dalam Ujian Putnam 2024 yang sangat kompetitif, dengan mudah melampaui skor tertinggi manusia yaitu 90.
Kehebatan model ini semakin diperkuat melalui IMO-ProofBench, yang membuatnya melampaui model seperti DeepThink milik DeepMind.
Sistem ini mengadu dua model bahasa besar satu sama lain, yang satu bertindak sebagai ‘pembukti’ untuk menghasilkan bukti matematika, sementara yang lain berfungsi sebagai ‘peninjau’ untuk meneliti alasannya.
Mekanisme semacam itu mengatasi keterbatasan kritis dalam tingkat pencapaian AI saat ini, di mana jawaban akhir yang benar tidak menjamin proses penalaran yang benar, menurut tim DeepSeek.
DeepSeek mengatakan terobosan ini menetapkan penalaran matematika yang memverifikasi dirinya sendiri sebagai jalur yang layak dan menjanjikan menuju pengembangan sistem AI matematika yang lebih kuat dan andal.
Laporan: Redaksi

.jpg)








