🤖 Microsoft AI выкатила сразу три новые мультимодальные ИИ-модели — для текста, голоса и изображений
MAI-Transcribe-1 переводит речь в текст на 25 языках и работает в 2,5 раза быстрее Azure Fast, MAI-Voice-1 генерирует минутную аудиодорожку всего за секунду, а MAI-Image-2 создает изображения по текстовому запросу.
В Microsoft делают ставку на собственную ИИ-инфраструктуру и более низкую стоимость вычислений по сравнению с решениями Google и OpenAI. Все модели уже доступны на платформе Microsoft Foundry, а инструменты для транскрипции и синтеза речи — еще и в MAI Playground.
Подписывайтесь на @arkanewsagency
MAI-Transcribe-1 переводит речь в текст на 25 языках и работает в 2,5 раза быстрее Azure Fast, MAI-Voice-1 генерирует минутную аудиодорожку всего за секунду, а MAI-Image-2 создает изображения по текстовому запросу.
В Microsoft делают ставку на собственную ИИ-инфраструктуру и более низкую стоимость вычислений по сравнению с решениями Google и OpenAI. Все модели уже доступны на платформе Microsoft Foundry, а инструменты для транскрипции и синтеза речи — еще и в MAI Playground.
Подписывайтесь на @arkanewsagency