屏幕




优势
特点
🌟多任务统一架构:LongCat-Video 将文本转视频、图像转视频和视频续播任务整合到一个视频生成框架中。它使用单一模型原生支持所有这些任务,并在每个任务中始终保持强大的性能。
🌟长视频生成:LongCat-Video 原生预训练于视频连续性任务,使其能够生成数分钟长的视频,而不会出现颜色漂移或质量下降。
🌟高效推理:LongCat-Video 生成720p,30fps通过采用由粗到精的生成策略,在时间和空间两个维度上都能生成视频,因此只需几分钟即可完成。块稀疏注意力机制进一步提高了效率,尤其是在高分辨率下。
🌟多奖励 RLHF 的强大性能:LongCat-Video 由多奖励组相对策略优化 (GRPO) 提供支持,在内部和公共基准测试上的全面评估表明,其性能可与领先的开源视频生成模型以及最新的商业解决方案相媲美。
相关推荐
- MorphCut该产品提供了一种新颖的框架,用于平滑跳切,特别是在对话视频中。它利用视频中主体的外观,通过 DensePose 关键点和面部标志驱动的中级表示来融合其他源帧中的信息。为了实现运动,它在切割周围的端帧之间插值关键点和标志。然后使用图像转换网络从关键点和源帧合成像素。由于关键点可能包含错误,因此提出了一种跨模态注意机制,以选择和为每个关键点挑选最合适的源。通过利用这种中级表示,我们的方法可以比强视频插值基准获得更强的结果。我们在对话视频的各种跳切上展示了我们的方法,例如切除填充词、暂停,甚至随机切割。我们的实验表明,即使在对话头部旋转或剧烈移动的挑战性情况下,我们也可以实现无缝过渡。
智谱清言清华大学孵化的智谱AI提供的千亿参数对话模型ChatGLM- 音子 AI音子 AI 是一款在线音轨分离解决方案,用户可上传音频或视频文件,立即获取独立的人声和伴奏文件。该产品基于人工智能技术,提供高效的音轨提取功能。
MootionAI原生3D动画创作平台
一起剪AI短视频创作平台,图文一键成片
Stable AudioStability Al最新推出的音乐生成工具- 风平智能风平 IP 智造平台是基于 AIGC 的智能化 IP 打造平台,致力于提供虚拟数字人定制、AI 短视频内容生产和数字人直播的一站式解决方案。通过结合领先的 AI 技术,平台实现了数字人的高质量生产和互动能力,为用户打造全新的数字人 IP 体验。
妙播腾讯广告推出的AI直播电商解决方案
RunwayRunway提供一系列易于使用的工具和平台,利用人工智能技术创造出令人惊叹的艺术作品和创意内容。他们的技术可以用于图像生成、视频编辑、音频合成、文字生成等多个创作领域。- Unscreen智能AI去除视频背景在线神器
LongCat-Video提供富有表现力且高度动态的音频驱动角色动画,支持包括音频文本转视频、音频文本图像转视频和视频连续播放在内的原生任务,并无缝兼容单流和多流音频输入。
万兴天幕万兴科技推出AIGC视频创作平台
元镜AI视频生成工具,支持多模态创意分镜创作服务- MagicDanceMagicDance是一种新颖有效的方法,可以生成逼真的人类视频,实现生动的动作和面部表情转移,以及一致的2D卡通风格动画零调优生成。通过MagicDance,我们可以精确生成外观一致的结果,而原始的T2I模型(如稳定扩散和ControlNet)很难准确地保持主题身份信息。此外,我们提出的模块可以被视为原始T2I模型的扩展/插件,而不需要修改其预训练权重。
度加创作工具度加创作工具是一个百度出品的、人人可用的AIGC创作平台。度加致力于通过AI能力降低内容生成门槛,提升创作效率,一站式聚合百度AIGC能力,引领跨时代的内容生产方式。度加的主要功能包括AI成片(图文成片/文字成片)、AI数字人等。
闪剪AI数字人短视频创作工具- 巨日禄AI巨日禄AI是一款全网性能卓越的故事AI绘画转视频工具,旨在让0基础小白也能轻松上手,快速实现从文案到视频的制作。该工具通过分析大量剧本数据和影视作品,为用户提供各种类型的故事情节和角色设置,帮助用户快速找到灵感,减少构思剧本的困难和犹豫。无需本地部署,快速出图,支持配音配乐,一站式解决小说、漫画推文等需求。角色固定,画风统一,提供多种风格选择。AI自动解析分镜,解析提示词,操作简单流畅,即使零基础小白也能轻松上手,做出精美的视频作品。
KreadoAIKreadoAI是一款数字营销创作平台,通过输入文本或关键词,可以创作真实/虚拟人物的多语言口播视频。为创作者提供AI赋能。同时,KreadoAI还提供模特创作平台,可以快速生成您的虚拟数字人,适用于假发、服装、美妆、眼镜等电商业务场景。- 百度度加创作工具百度旗下产品,打造人人可用的AI创作工具
D-IDD-ID是一个创意AI平台,使用AI技术将照片转换为视频。它可以轻松地从文本生成视频,为培训材料、内部沟通、营销等提供AI驱动的、经济实惠的视频解决方案。D-ID还可以实现与聊天机器人进行面对面的对话,使用户获得更加沉浸式和人性化的体验。D-ID还提供API和自助工作室,供开发人员使用。
热门工具
RunningHub基于云端ComfyUI的AI图像与视频创作平台
腾讯元器腾讯混元大模型团队推出的智能体开放平台,开发者可以通过插件、知识库、工作流等方式快速、低门槛打造高质量的智能体。- Open AutoGLM基于AutoGLM 构建的手机端智能助理框架,它能够以多模态方式理解手机屏幕内容,并通过自动化操作帮助用户完成任务。
AutoSubs - AI字幕一键创建高质量字幕。AutoSubs 提供快速、准确且完全可自定义的字幕,界面简洁直观。现在可与 DaVinci Resolve 配合使用,也可独立运行。
HeyFridayFriday AI智能写作平台,一键生成高质量原创内容! Friday AI-国内顶尖算法模型,AI自动生成原创文章,支持改写,续写,扩写,搜索引擎优化,全场景媒体运营神器!- 百炼阿里云大模型服务平台,提供AI模型训练、部署、推理一站式服务,支持多种大模型框架,助力企业快速构建AI应用。
- SkidHomework - AI开源作业帮AI驱动家庭作业批改解答工具,支持拍照上传以及PDF文件,无需下载浏览器直接运行
- Langflow一个功能强大的平台,用于构建和部署 AI 驱动的代理和工作流。它为开发者提供可视化创作体验以及内置的API和MCP服务器,可以将每个工作流转化为可集成到基于任何框架或技术栈构建的应用程序中的工具。
- 拍我AI一站式生成有趣AI视频、创意AI图片和专属AI智能体。海量AI模板一键套用,让视频、图片创作零门槛。释放无限想象力,即刻拍出你的AI大作!
玫瑰克隆工具玫瑰克隆工具- AI图文笔记一键生成创作并自动发布助手
一站式AI工具导航网站,集纳市面领先AI工具,包括AI绘图、AI对话、AI编程、AI视频编辑、AI设计与AI音频处理等,提供最新、最全的AI资源。

















