Microsoft'un yeni Phi-4 AI modelleri küçük paketlerde büyük performans sunuyor

Sektör lideri AI kapsamına ilişkin en son güncellemeler ve özel içerikler için günlük ve haftalık bültenlerimize katılın. Daha Fazla Bilgi Edinin
Microsoft, mevcut sistemlerden önemli ölçüde daha az işlem gücü gerektirirken metni, görüntüleri ve konuşmayı aynı anda işleyen yeni bir yüksek verimli AI modelleri sınıfı tanıttı. Bugün yayınlanan yeni Phi-4 modelleri , daha önce çok daha büyük AI sistemleri için ayrılmış yetenekleri sunan küçük dil modelleri (SLM'ler) geliştirmede bir atılımı temsil ediyor.
Microsoft'un teknik raporuna göre, sadece 5,6 milyar parametresi olan Phi-4-Multimodal modeli ve 3,8 milyar parametresi olan Phi-4-Mini , benzer büyüklükteki rakiplerini geride bırakıyor ve hatta bazı görevlerde kendilerinden iki kat daha iyi performans gösteriyor veya onları geçiyor.
Microsoft'ta Üretken Yapay Zeka Başkan Yardımcısı Weizhu Chen, "Bu modeller, geliştiricilere gelişmiş yapay zeka yetenekleri kazandırmak için tasarlandı" dedi. "Konuşma, görme ve metni aynı anda işleme yeteneğiyle Phi-4-multimodal, yenilikçi ve bağlam farkında uygulamalar yaratmak için yeni olasılıklar sunuyor."
Bu teknik başarı, işletmelerin maliyetleri ve gecikmeyi azaltırken veri gizliliğini korumak için standart donanımlarda veya " uçta " (bulut veri merkezlerinde değil, doğrudan cihazlarda) çalışabilen yapay zeka modellerine giderek daha fazla yöneldiği bir zamanda geldi.
Phi-4-Multimodal'ı farklı kılan şey, tek bir model içinde metin, görüntü ve konuşma girişlerini işlemesini sağlayan yenilikçi " LoRA karışımı " tekniğidir.
Araştırma makalesinde , "LoRA'ların Karışımından yararlanarak Phi-4-Multimodal, modaliteler arasındaki müdahaleyi en aza indirirken çok modlu yetenekleri genişletir" ifadesi yer alıyor. "Bu yaklaşım, metin, görüntü ve konuşma/ses içeren görevler arasında sorunsuz entegrasyonu mümkün kılar ve tutarlı performansı garanti eder."
Bu yenilik, modelin çoklu girdi türlerine uyarlandığında sıklıkla görülen performans düşüşü olmadan, güçlü dil yeteneklerini korurken görme ve konuşma tanıma özelliklerini de eklemesine olanak sağlıyor.
Model, %6,14'lük bir kelime hata oranıyla Hugging Face OpenASR liderlik tablosunda en üst sıraya yerleşti ve WhisperV3 gibi özel konuşma tanıma sistemlerini geride bıraktı. Ayrıca, görsellerle matematiksel ve bilimsel akıl yürütme gibi görsel görevlerde rekabetçi bir performans sergiliyor.
Kompakt boyutuna rağmen Phi-4-Mini , metin tabanlı görevlerde olağanüstü yetenekler sergiliyor. Microsoft, modelin çeşitli dil anlama kıyaslamalarında "benzer boyuttaki modellerden daha iyi performans gösterdiğini ve iki kat daha büyük modellerle aynı seviyede olduğunu" bildiriyor.
Özellikle modelin matematik ve kodlama görevlerindeki performansı dikkat çekicidir. Araştırma makalesine göre, “Phi-4-Mini, 3.072 gizli durum boyutuna sahip 32 Transformer katmanından oluşur” ve uzun bağlam üretimi için bellek kullanımını optimize etmek üzere grup sorgu dikkatini içerir.
GSM-8K matematik kıyaslamasında Phi-4-Mini, %88,6'lık bir puan alarak 8 milyar parametreli modellerin çoğunu geride bırakırken, MATH kıyaslamasında ise benzer büyüklükteki rakiplerinden önemli ölçüde daha yüksek olan %64'lük bir puana ulaştı.
Teknik raporda, "Matematik kıyaslaması için, model benzer büyüklükteki modellerden büyük marjlarla, bazen 20 puandan fazla, daha iyi performans gösteriyor. Hatta daha büyük modellerin puanlarından iki kat daha iyi performans gösteriyor" denildi.
Kuruluşların çeşitli veri kümelerini birleştirmesine yardımcı olan bir Yapay Zeka Cevap Motoru olan Capacity , platformlarının verimliliğini ve doğruluğunu artırmak için halihazırda Phi ailesinden yararlanıyor.
Kapasite Ürün Müdürü Steve Frederickson bir açıklamasında şunları söyledi: "İlk deneylerimizden itibaren, Phi'de bizi gerçekten etkileyen şey, özelleştirmeden önce bile olağanüstü doğruluğu ve dağıtım kolaylığıydı. O zamandan beri, başlangıçtan itibaren değer verdiğimiz maliyet etkinliğini ve ölçeklenebilirliği korurken hem doğruluğu hem de güvenilirliği artırabildik."
Kapasite, ön işleme görevlerinde aynı veya daha iyi nitel sonuçlar elde ederken rakip iş akışlarına kıyasla 4,2 kat maliyet tasarrufu bildirdi.
Yıllardır, AI geliştirme tek bir felsefe tarafından yönlendirildi: daha büyük daha iyidir. Daha fazla parametre, daha büyük modeller, daha büyük hesaplama talepleri. Ancak Microsoft'un Phi-4 modelleri bu varsayımı sorgulayarak gücün yalnızca ölçekle ilgili olmadığını, verimlilikle ilgili olduğunu kanıtlıyor.
Phi-4-Multimodal ve Phi-4-Mini , teknoloji devlerinin veri merkezleri için değil, bilgi işlem gücünün sınırlı olduğu, gizlilik endişelerinin en üst düzeyde olduğu ve yapay zekanın buluta sürekli bağlı olmadan sorunsuz bir şekilde çalışması gereken gerçek dünya için tasarlanmıştır. Bu modeller küçüktür, ancak ağırlık taşırlar. Phi-4-Multimodal, doğruluktan ödün vermeden konuşma, görme ve metin işlemeyi tek bir sistemde birleştirir; Phi-4-Mini ise boyutunun iki katı olan modellerle aynı seviyede matematik, kodlama ve muhakeme performansı sunar.
Bu sadece AI'yı daha verimli hale getirmekle ilgili değil; onu daha erişilebilir hale getirmekle ilgili. Microsoft, Phi-4'ü yaygın olarak benimsenmesi için konumlandırdı ve Azure AI Foundry , Hugging Face ve Nvidia API Catalog aracılığıyla kullanılabilir hale getirdi. Amaç açık: Pahalı donanım veya devasa altyapının arkasında kilitli olmayan, ancak standart cihazlarda, ağların ucunda ve hesaplama gücünün kıt olduğu endüstrilerde çalışabilen bir AI.
Japon AI firması Headwaters Co., Ltd.'de yönetici olan Masaya Nishimaki, etkiyi ilk elden görüyor. "Edge AI, istikrarsız ağ bağlantılarının olduğu veya gizliliğin çok önemli olduğu ortamlarda bile olağanüstü performans gösteriyor," dedi bir açıklamada . Bu, fabrikalarda, hastanelerde, otonom araçlarda, yani gerçek zamanlı zekanın gerekli olduğu ancak geleneksel bulut tabanlı modellerin yetersiz kaldığı yerlerde işlev görebilen AI anlamına geliyor.
Özünde, Phi-4 düşüncede bir değişimi temsil eder. Yapay zeka yalnızca en büyük sunuculara ve en derin ceplere sahip olanlar için bir araç değildir. İyi tasarlanırsa, her yerde, herkes için çalışabilen bir yetenektir. Phi-4'ün en devrim niteliğindeki özelliği ne yapabildiği değil, bunu nerede yapabildiğidir.
Patronunuzu etkilemek istiyorsanız, VB Daily sizin için burada. Şirketlerin üretken yapay zeka ile ilgili olarak düzenleyici değişikliklerden pratik dağıtımlara kadar neler yaptıklarına dair içeriden bilgiler veriyoruz, böylece maksimum yatırım getirisi için içgörüler paylaşabilirsiniz.
Gizlilik Politikamızı okuyun
Abone olduğunuz için teşekkürler. Daha fazla VB bültenine buradan göz atın.
Bir hata oluştu.

venturebeat