
MiniMax Audio
About
MiniMax推出的AI语音合成工具,支持声音克隆
Categories
AI 语音生成
Tags
免费使用正常访问无需登录
Other
收录日期:2025/11/27 17:47:21
相关推荐
VoicemakerAI文本到语音生成工具
Stable AudioStability Al最新推出的音乐生成工具- Eleven LabsElevenLabs 带来了最逼真、丰富和生动的声音,为寻求叙事的终极工具的创作者和发布者提供了最具吸引力的文本转语音和语音克隆软件。
- Vocal RemoverVocal Remover使用强大的AI算法免费将歌曲中的人声与音乐分离。
- VLOGGERVLOGGER是一种从单张人物输入图像生成文本和音频驱动的讲话人类视频的方法,它建立在最近生成扩散模型的成功基础上。我们的方法包括1)一个随机的人类到3D运动扩散模型,以及2)一个新颖的基于扩散的架构,通过时间和空间控制增强文本到图像模型。这种方法能够生成长度可变的高质量视频,并且通过对人类面部和身体的高级表达方式轻松可控。与以前的工作不同,我们的方法不需要为每个人训练,也不依赖于人脸检测和裁剪,生成完整的图像(而不仅仅是面部或嘴唇),并考虑到正确合成交流人类所需的广泛场景(例如可见的躯干或多样性主体身份)。
- EMO阿里巴巴的EMO: 是一款生成具有表情丰富的面部表情视频的工具,可以根据输入的角色图像和声音音频生成各种头部姿势和表情的声音头像视频。支持多语言歌曲和各种肖像风格,能够根据音频节奏生成动态、表现丰富的动画角色。
海绵音乐海绵音乐 - 一键创作你的 AI 音乐- AniPortraitAniPortrait是一个根据音频和图像输入生成会说话、唱歌的动态视频的项目。它能够根据音频和静态人脸图片生成逼真的人脸动画,口型保持一致。支持多种语言和面部重绘、头部姿势控制。功能包括音频驱动的动画合成、面部再现、头部姿势控制、支持自驱动和音频驱动的视频生成、高质量动画生成以及灵活的模型和权重配置。
讯飞听见讯飞听见是智慧办公服务平台,提供语音转文字、录音整理、语音翻译等服务,致力于提高办公效率。支持快速转录音频、视频为文字,提供 AI 写作、同传、翻译等功能。- OCTAVEOCTAVE (Omni-Capable Text and Voice Engine)是一个结合了前沿语言模型和语音系统能力的下一代语音语言模型。它能够从简短的描述性提示或录音中生成不仅仅是声音,还有个性(语言、口音、表达、潜在性格等),并且能够实时响应中生成多个交互的AI个性和声音。OCTAVE维持了类似大小的前沿大型语言模型(LLM)的能力,非常适合驱动与人类丰富沟通的AI系统,同时遵循详细指令,使用工具或控制界面。
- Text To Audio—TTS & MP3_WAVText2Audio是一款免费的文本转语音应用,通过一键操作将文本转换为音频文件。用户可以选择多个智能声音演员,还可以根据需要调整语速和音调,创建男声、女声、叙述等不同类型的声音。适用于制作短视频解说的评论,如TikTok、YouTube、Instgram等。
刺鸟配音刺鸟科技推出的专业AI配音工具
VoicenotesAI驱动的语音笔记工具
WellSaidAI文本转语音工具- VoicefyVoicefy是一款直观的平台,将文本转化为真实的语音,提供多种语言和声音选择,以提高内容的可访问性和互动性。Voicefy可用于创建有声书、自动化广告、医疗指导录音等。价格根据使用情况而定,提供免费试用。
- MVSEPMVSEP是一款在线音频处理工具,利用先进的音频分离技术可将音乐和语音从音频文件中分离出来,适用于音乐制作、音频编辑、广播、电影后期制作等领域。优点包括高质量的音频输出、快速的处理速度和用户友好的操作界面。提供不同模型选择。
Lalal.aiLALAL.AI是一款下一代音乐分轨器和人声消除器,采用世界一流的AI技术,快速、简便、准确地分离音乐的不同部分。无损地去除人声、乐器、鼓、贝斯、钢琴、电吉他、原声吉他和合成器等轨道。
Lyrics Into Song AI在线AI音乐创作工具,输入歌词创建个性化歌曲
Mureka昆仑万维推出的 AI 音乐商用创作平台
NottaNotta可以在在线会议、面对面销售会议等场景中快速转录您的音频或视频文件为文字内容。
热门工具
- 拍我AI一站式生成有趣AI视频、创意AI图片和专属AI智能体。海量AI模板一键套用,让视频、图片创作零门槛。释放无限想象力,即刻拍出你的AI大作!
- 百炼阿里云大模型服务平台,提供AI模型训练、部署、推理一站式服务,支持多种大模型框架,助力企业快速构建AI应用。
- SkidHomework - AI开源作业帮AI驱动家庭作业批改解答工具,支持拍照上传以及PDF文件,无需下载浏览器直接运行
WellSaidAI文本转语音工具
腾讯元器腾讯混元大模型团队推出的智能体开放平台,开发者可以通过插件、知识库、工作流等方式快速、低门槛打造高质量的智能体。
Artbreeder在线AI图像合成创意工具- Gemini CLIGemini CLI 是一个开源 AI 代理,可将 Gemini 的强大功能直接带入您的终端。它提供了对 Gemini 的轻量级访问,为您提供从提示到我们模型的最直接路径。
BeatBotSplash的AI音乐生成器- FastGPT企业级AI Agent搭建平台,可以基于LLM大语言模型搭建AI知识库问答系统,提供开箱即用的AI Agent工具集及大模型。
- 图片去水印图片去水印工具利用强大的 AI 技术,帮助用户快速去除图像上的水印,提高创作自由和社交媒体效果。产品定位于提供便捷的水印去除服务,以增强用户体验为目标。
一站式AI工具导航网站,集纳市面领先AI工具,包括AI绘图、AI对话、AI编程、AI视频编辑、AI设计与AI音频处理等,提供最新、最全的AI资源。













