IndexTTS2 IndexTTS2 是一个突破性的自回归语音合成模型,旨在解决大规模文本到语音(TTS)系统在精确时长控制和情感表达方面的挑战。 0840 AI大模型# AI大模型# IndexTTS2
Moondream Moondream 是一个开源的轻量级视觉语言模型,由开发者 vikhyatk 推出,旨在提供高效、灵活的图像理解和文本生成能力。 0830 AI大模型# AI大模型# Moondream
sql-llm-benchmark 专注于语言模型(LLM)SQL 能力评测的专业平台,构建了全面且具实践价值的 SQL 能力排行榜(SCALE),为开发者、数据库管理员及企业技术决策者提供关键参考 0710 AI大模型# AI大模型# sql-llm-benchmark
53AI 53AI企业大模型应用平台是大中型企业广泛采用大模型落地应用平台,系统实现对全部主流大模型的统一纳管,包括DeepSeeK、OpenAI、Azure OpenAI、文心一言、讯飞星火、零一、LlaMa 0640 AI大模型# 53AI# AI大模型
Hallo Hallo 是一个由复旦大学(Fudan University)开发的开源项目,专注于音频驱动的视觉合成技术,特别是用于人像动画生成。 0640 AI大模型# AI大模型# ai数字人# Hallo
讯飞星辰MaaS平台 讯飞星辰MaaS平台是科大讯飞推出的一款一站式大模型定制精调平台,旨在为开发者和企业用户提供低门槛、全栈式的大模型应用开发服务。 0630 AI大模型# AI大模型# 讯飞星辰# 讯飞星辰MaaS平台
SadTalker SadTalker 是一个基于单张图像和音频生成说话人脸视频的模型,其核心功能是通过音频输入使静态图片中的图像动起来,并生成说话的虚拟人物。 0630 AI大模型# AI大模型# SadTalker
Veo3 Veo 3 是 Google DeepMind 推出的新一代视频生成模型,专为电影制作人、故事讲述者和创意工作者设计,将视频与音频无缝结合,开启生成式 AI 的创作新篇章。 0630 AI大模型# AI大模型# Veo3
Qwen-Image Qwen-Image 是阿里通义千问团队于2025年8月5日开源的200亿参数图像生成基础模型,采用MMDiT架构,专为复杂文本渲染与高精度图像生成设计。 0620 AI大模型# AI大模型# Qwen-Image# 通义千问
Seedance 字节跳动开发的AI视频生成模型,模型能够根据文本或图像生成高质量的视频内容,支持多镜头切换、稳定运动轨迹和风格化控制,适用于创意内容创作、广告制作和教育演示等场景。 0620 AI大模型# AI大模型# Seedance
AI Ping AI Ping是面向大模型使用者,提供全面、客观、真实的大模型服务评测与信息汇总平台。提供长周期、高频率、多时段评测数据,助力您高效完成大模型服务的选型与供应商评估 0620 AI大模型# AI Ping# AI大模型
Grsai API Grsai聚合了各种优秀的主流图片与视频生成大模型,以低于官网好几倍的价格为您降低使用成本!提供企业级专业稳定的API中转站,服务稳定可靠,达到99.99%。 0600 AI大模型# AI大模型# API# Grsai API
元象大模型 XChat 元象大模型XChat是一款由元象科技自主研发的高性能通用人工智能大模型,旨在降低开发门槛与推理成本,满足多任务需求。 0590 AI大模型# AI大模型# XChat# 元象大模型
LMArena 一个与人工智能(AI)模型评估和比较相关的平台,其核心功能是通过用户投票和社区参与的方式,对大型语言模型(LLM)进行评测和排名。 0580 AI大模型# AI大模型# LMArena# LMArena.ai
LivePortrait LivePortrait是一款由快手科技与中国科学技术大学、复旦大学共同研发的AI驱动肖像动画工具,旨在将静态肖像图像转化为逼真的动态视频。 0550 AI大模型# AI大模型# LivePortrait
MuseTalk MuseTalk 是一个实时高质量音频驱动唇形同步模型,旨在解决高分辨率、身份一致性和准确唇形同步的面部视觉配音挑战,尤其适用于实时应用如直播视频 。 0540 AI大模型# AI大模型# MuseTalk