屏幕




优势
特点
🌟多任务统一架构:LongCat-Video 将文本转视频、图像转视频和视频续播任务整合到一个视频生成框架中。它使用单一模型原生支持所有这些任务,并在每个任务中始终保持强大的性能。
🌟长视频生成:LongCat-Video 原生预训练于视频连续性任务,使其能够生成数分钟长的视频,而不会出现颜色漂移或质量下降。
🌟高效推理:LongCat-Video 生成720p,30fps通过采用由粗到精的生成策略,在时间和空间两个维度上都能生成视频,因此只需几分钟即可完成。块稀疏注意力机制进一步提高了效率,尤其是在高分辨率下。
🌟多奖励 RLHF 的强大性能:LongCat-Video 由多奖励组相对策略优化 (GRPO) 提供支持,在内部和公共基准测试上的全面评估表明,其性能可与领先的开源视频生成模型以及最新的商业解决方案相媲美。
相关推荐
LTX StudioLTX Studio是一个集成了AI技术的创新视频制作平台,它允许用户从概念到最终剪辑,全面控制视频的各个方面。该平台通过AI技术,将创意转化为连贯的视频故事,提供角色一致性、自动编辑、深度帧控制等功能,旨在简化视频制作流程,提高创作效率。
Dream MachineLuma AI推出的AI视频生成工具- AI Product PhotosAI产品照片生成器是一个能够在几秒钟内生成增加销售的产品图片和照片的工具。它可以将产品图片转化为专业的产品照片,提高销售效果。使用这个工具,您可以添加AI背景,避免标签模糊或形状变化的问题。我们的AI照片生成器采用了全新的文本到图像扩散模型,专门为销售进行了训练和优化。您可以从Shopify中直接生成照片,并将其与我们的视频模板配合使用。生成的产品图片可以免费使用,并且您只需要为您真正喜欢的图片付费。
ViduVidu 是一个创新的 AI 视频生成模型,能够根据用户提供的文本或图片快速生成高质量的视频内容。它的技术基于深度学习,能够理解并分析输入信息,从而创造出富有创意和视觉吸引力的视频。随着视频内容在各类平台上的流行,Vidu 以其便捷性和高效性,成为了内容创作者和市场营销人员的得力助手。该产品适用于个人和企业用户,旨在帮助他们提升内容制作的效率,且目前提供免费试用以吸引更多用户尝试其强大的功能。- BibiGPT一键总结B站音视频内容
- Play基于人工智能将文本转位逼真的语音
Audo Studio听起来很棒!AI一键清除音频背景杂音
SekoTalk商汤科技推出的AI对口型工具- 风平智能风平 IP 智造平台是基于 AIGC 的智能化 IP 打造平台,致力于提供虚拟数字人定制、AI 短视频内容生产和数字人直播的一站式解决方案。通过结合领先的 AI 技术,平台实现了数字人的高质量生产和互动能力,为用户打造全新的数字人 IP 体验。
Duix硅基智能推出的AI数字人生成平台
Stable AudioStability Al最新推出的音乐生成工具
Viva免费的AI视频生成和图像创作平台
OneStory专业的AI故事生成助手- GoEnhance AIGoEnhance AI是一款基于人工智能的图像和视频增强工具。它可以实现视频到视频、图像增强和超分辨率scaling等功能。GoEnhance AI采用了最先进的深度学习算法,可以增强和上采样图像到极致的细节和高分辨率。它简单易用,功能强大,是创作者、设计师等用户释放创意的绝佳工具。
度加创作工具度加创作工具是一个百度出品的、人人可用的AIGC创作平台。度加致力于通过AI能力降低内容生成门槛,提升创作效率,一站式聚合百度AIGC能力,引领跨时代的内容生产方式。度加的主要功能包括AI成片(图文成片/文字成片)、AI数字人等。- Loom使用 Loom AI 录制更好、更快的视频消息,让您的工作更加高效。
- 快剪辑SaaS版快剪辑SaaS版是一款AI工具,提供丰富的视频模板库和智能剪辑功能,帮助用户快速创建高质量的视频内容。产品定价灵活,适用于个人创作者和企业用户。主要功能包括智能去字幕、智能去水印、智能抠像等。适用场景包括企业宣传、纪录片制作、个人创作等。
- SwapStreamSwapStream是一个基于云的实时人脸互换直播工具,用户可以通过浏览器轻松实现人脸互换的直播。它支持将任意人脸实时互换到直播视频中,同时可以多路流媒体直播到各种直播平台。主要功能包括:实时人脸互换,无需下载直接在浏览器使用,支持多种直播平台,可添加自定义RTMP直播通道等。优点是使用简单、扩展性强,适用于各类直播场景。
- Artflow AIArtflow.ai可以在浏览器中借助人工智能帮助你创建独特的动画故事,包括原创角色、场景和对话。让你的创意流淌,以全新的方式呈现你的故事。
- WanWan是阿里巴巴通义实验室开发的先进视觉生成模型,具备强大的视频生成能力。它能够根据文本、图像及其他控制信号生成视频。Wan2.1系列模型现已完全开源。其主要优点包括卓越的复杂运动生成能力,能够生成逼真的视频,涵盖广泛的身体动作、复杂旋转、动态场景转换和流畅的镜头运动;精准的物理模拟,生成符合真实物理规律的视频;电影质感的画面,提供丰富的纹理和多样化的风格化效果;可控的编辑功能,支持使用图像或视频参考进行精确编辑。该模型的开源为视频生成领域带来了新的可能性,降低了使用门槛,推动了相关技术的发展。
热门工具
- 拍我AI一站式生成有趣AI视频、创意AI图片和专属AI智能体。海量AI模板一键套用,让视频、图片创作零门槛。释放无限想象力,即刻拍出你的AI大作!
腾讯元器腾讯混元大模型团队推出的智能体开放平台,开发者可以通过插件、知识库、工作流等方式快速、低门槛打造高质量的智能体。- 百炼阿里云大模型服务平台,提供AI模型训练、部署、推理一站式服务,支持多种大模型框架,助力企业快速构建AI应用。
- Open AutoGLM基于AutoGLM 构建的手机端智能助理框架,它能够以多模态方式理解手机屏幕内容,并通过自动化操作帮助用户完成任务。
Tabby - AI编码助手一款可自行托管的 AI 代码助手,为 GitHub Copilot 提供了一种开源的本地部署替代方案,支持VS Code,JetBrains,VIM 。
精选500+AI Agent应用精选各行业AI Agent应用案例,包括CrewAI Agent用例,自动生成Agent用例,Agno用例,Langgraph用例.- SkidHomework - AI开源作业帮AI驱动家庭作业批改解答工具,支持拍照上传以及PDF文件,无需下载浏览器直接运行
WellSaidAI文本转语音工具- FastGPT企业级AI Agent搭建平台,可以基于LLM大语言模型搭建AI知识库问答系统,提供开箱即用的AI Agent工具集及大模型。
BeatBotSplash的AI音乐生成器
一站式AI工具导航网站,集纳市面领先AI工具,包括AI绘图、AI对话、AI编程、AI视频编辑、AI设计与AI音频处理等,提供最新、最全的AI资源。















