Microsoft представила дві власні моделі штучного інтелекту, створені повністю без участі OpenAI. Розробка цих моделей — MAI-1-preview і MAI-Voice-1 — є першою спробою компанії побудувати незалежну AI-екосистему з нуля, що сигналізує про поступовий відхід від ексклюзивної залежності від технологій OpenAI.
MAI-Voice-1 — це перша високоякісна модель генерації мовлення Microsoft. Вона створена для того, щоб зробити спілкування з Copilot більш природним і виразним. Цей голосовий AI здатний генерувати хвилину аудіо менш ніж за секунду на одному GPU, що робить його одним із найефективніших рішень у галузі.
Сьогодні MAI-Voice-1 вже використовується в функціях Copilot Daily, Podcasts та Copilot Labs. Там користувачі можуть створювати інтерактивні історії, медитації чи голосові відповіді — лише за допомогою текстового запиту.
MAI-1-preview — це перша повноцінна foundation-модель, натренована end-to-end на близько 15 000 GPU NVIDIA H100. Вона побудована за принципом mixture-of-experts і вже доступна для відкритого тестування на платформі LMArena. Microsoft також надає доступ до API обмеженому колу тестувальників.
У найближчі тижні MAI-1-preview з’явиться у деяких функціях Copilot, де Microsoft збиратиме зворотний зв’язок для подальшого вдосконалення.