多模态AI
-
OpenAI推出全新语音AI模型:gpt-4o-transcribe,让你的文本应用秒变语音交互神器
OpenAI,这家因ChatGPT而广为人知的AI公司,近日再次在语音AI领域迈出重要一步。公司宣布推出三款全新的语音模型——gpt-4o-transcribe、gpt-4o-mi…
-
Google的Gemini 2.0 Flash:原生多模态AI图像生成引领快速编辑与风格转换潮流
Google近期推出的Gemini 2.0 Flash模型,以其原生多模态AI图像生成能力,在AI界掀起了新一轮的创新风暴。这款模型不仅将文本与图像生成功能融为一体,还实现了快速的…