AI张禹

LeX-Art，通过可扩展的高质量数据合成重新思考文本生成，可以在图像中生成清晰、对齐良好且美观的文本

LeX-Art，通过可扩展的高质量数据合成重新思考文本生成，可以在图像中生成清晰...

BizGen，微软开源的信息图表生成的文章级可视化文本渲染，可以生成信息图表与幻灯片

BizGen，微软开源的信息图表生成的文章级可视化文本渲染，可以生成信息图表与幻...

GPT-4o迎来更新，更新后的 GPT-4o 现已面向所有付费用户开放，免费用户将在未来几周内开放

GPT-4o迎来更新，更新后的 GPT-4o 现已面向所有付费用户开放，免费用户...

Qwen推出QVQ-Max视觉推理模型，不仅能够“看懂”图片和视频里的内容，还能结合这些信息进行分析、推理，甚至给出解决方案

Qwen推出QVQ-Max视觉推理模型，不仅能够“看懂”图片和视频里的内容，还能...

2025.3.27 AI日报

AI资讯 Ideogram推出Ideogram 3.0模型，令人惊叹的真实感、创...

基础项目实战篇二：Git下载安装以及必须知道的Git常用指令

Git主要用到的地方也就是Github上传与拉取项目，一般我们用到的AI编程软件...

MoshiVis，基于Moshi开发的视觉语音模型，支持自然的对话风格和低延迟

让我们看看演示视频吧！ MoshiVis，基于Moshi开发的视觉语音模型，支持...

OpenAI Agents SDK 也支持 MCP ，即将为 OpenAI API 和 ChatGPT 桌面应用程序提供 MCP 支持

OpenAI Agents SDK 也支持 MCP ，即将为 OpenAI AP...

Ideogram推出Ideogram 3.0模型，令人惊叹的真实感、创意设计和一致的风格

Ideogram推出Ideogram 3.0模型，令人惊叹的真实感、创意设计和一...

FirePlace，对 3D 对象放置常识推理，可根据语言指令为要插入 3D 场景的新 3D 对象生成对象位置

让我们看看演示视频吧！ FirePlace，对 3D 对象放置常识推理，可根据语...

Qwen2.5-Omni，Qwen开源的端到端多模态大模型，无缝处理包括文本、图像、音频和视频在内的各种输入，同时支持流式的文本生成和自然语音合成输出

Qwen2.5-Omni，Qwen开源的端到端多模态大模型，无缝处理包括文本、图...

2025.3.26 AI日报

AI资讯 ChatGPT 4o支持图像生成，向所有 Plus、Pro、Team ...