通义千(qian)问发布了 Qwen2.5-Omni,Qwen 模型家族中(zhong)新一(yi)代端到(dao)端多模态旗舰模型。该模型专为全方(fang)位多模态感知设计,能够无(wu)缝处理文本、图像、音频和视(shi)频等多种输入形式,并通过实时流式响应同时生成文本与自然(ran)语(yu)音合成输出。该模型现已在 Hugging Face、ModelScope、DashScope 和 GitHub上开源开放,用(yong)户可以通过我(wo)们的Demo体验互动功能,或(huo)是通过Qwen Chat 直接发起语(yu)音或(huo)视(shi)频聊天,沉(chen)浸式体验全新的 Qwen2.5-Omni 模型强大性能。