Microsoft AI, o braço de pesquisa da gigante tecnológica, anunciou o lançamento de três modelos multimodais fundamentais — MAI-Transcribe-1, MAI-Voice-1 e MAI-Image-2. O modelo de transcrição suporta 25 idiomas e é 2,5 vezes mais rápido que o Azure Fast. O modelo de voz pode gerar um minuto de áudio em um segundo e permite a criação de vozes personalizadas. O modelo de imagem, originalmente lançado no MAI Playground, expande a carteira de AI da Microsoft e é preço para ser mais barato do que as ofertas concorrentes da Google e da OpenAI.
Leia mais →