MotionAgent MotionAgent是一个能将用户创造的剧本生成视频的深度学习模型工具。用户通过我们提供的工具组合,进行剧本创作、剧照生成、图片/视频生成、背景音乐谱写等工作。 0170 项目框架# MotionAgent# 阿里ai# 项目框架
EmotiVoice易魔声 EmotiVoice是一个强大的开源TTS引擎,完全免费,支持中英文双语,包含2000多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。 0170 项目框架# EmotiVoice# 易魔声# 项目框架
MCP Feedback Enhanced MCP Feedback Enhanced 是一个基于 Model Context Protocol(MCP)的反馈驱动开发工具,旨在通过用户确认而非推测操作,优化AI交互流程,提升开发效率。 0170 项目框架# 项目框架
browser-use Browser Use 是一款专为大语言模型设计的智能浏览器工具。它是将 AI 智能体与浏览器连接起来的最简单方式,通过提供强大且简单的浏览器自动化接口,让 AI 智能体能够访问各类网站。 0170 项目框架# ai浏览器自动化# browser-use# 浏览器自动化
PaddleSpeech 百度飞桨(PaddlePaddle)平台上的一个开源语音处理工具包,旨在为语音识别、语音合成、语音翻译、语音识别、语音分类、语音标点恢复、语音情感分析等任务提供全面的解决方案。 0170 项目框架# PaddleSpeech# 百度# 百度飞桨
Bytebot 一个开源的 AI 桌面代理,旨在通过自然语言指令自动化计算机任务,允许用户通过简单的自然语言命令执行复杂的任务,如网页浏览、数据处理、文件管理等,无需编写复杂代码 。 0170 项目框架# Bytebot# 项目框架
LangGraph LangGraph 是一个用于构建、管理和部署长运行、有状态代理(agents)的低级编排框架。它被广泛应用于需要构建复杂、可扩展、可持久化代理系统的场景。 0170 项目框架# LangGraph# 项目框架
LlamaIndex 一个用于构建 LLM(大型语言模型)应用的数据框架,提供了一套工具和框架,帮助开发者将私有数据与 LLM 结合使用,以增强知识生成和推理能力。 0170 项目框架# LlamaIndex# 项目框架
Youtu-Agent Youtu-Agent 是腾讯优图实验室于 2025 年 9 月 2 日正式开源的智能体构建框架。是一个灵活、高性能的框架,用于构建、运行和评估自主智能体。 0170 项目框架# Youtu-Agent# 项目框架
Video-Analyzer 一个视频分析工具,结合了视觉模型(如Llama的11B视觉模型)和Whisper进行语音识别,通过提取关键帧并进行分析,生成视频内容的描述。 0170 项目框架# 项目框架
Vercel AI SDK AI SDK 是一个由 Vercel 推出的 TypeScript 工具包,旨在帮助开发者使用 React、Next.js、Vue、Svelte、Node.js 等技术构建 AI 驱动的应用。 0170 项目框架# Vercel AI SDK# 项目框架
TradingAgents 一个开源的多智能体交易框架,旨在模拟真实世界交易公司的动态,通过多个专业智能体(如基本面分析师、情绪分析师、技术分析师等)协同工作,评估市场条件并做出交易决策。 0170 项目框架# TradingAgents# 项目框架
TradingAgents-CN TradingAgents-CN 是一个基于多智能体大语言模型的中文金融交易决策框架,专为中文用户优化,提供完整的A股、港股、美股分析能力。 0170 项目框架# TradingAgents# TradingAgents-CN# 项目框架
DeepFlow DeepFlow 是由云杉网络(Yunshan Networks)研发的 全栈可观测性平台,面向云原生、分布式系统以及 AI 应用,提供从底层网络到业务层的统一监控、追踪和性能剖析能力。 0170 项目框架# DeepFlow# 项目框架
Midscene.js Midscene.js 是一个基于人工智能(AI)技术的自动化 SDK,旨在简化用户界面(UI)自动化测试流程,提高测试效率和准确性。 0160 项目框架# Midscene.js# 项目框架
PoloAPI PoloAPI 是一个专注于大模型 API 聚合服务的平台,旨在帮助开发者和企业快速接入和使用多种 AI 模型,如 Claude、OpenAI、Gemini 等。 0160 项目框架# API# PoloAPI# 项目框架
Gemini CLI Gemini CLI 是一个开源的 AI 代理工具,由 Google 开发,旨在将 Gemini 模型的强大功能直接集成到开发者的终端中 。 0160 项目框架# Gemini CLI# 项目框架
DeepSeek实用集成 DeepSeek官方推出的一站式集成资源库,旨在帮助用户将DeepSeek AI能力无缝集成到各类应用中。 0160 项目框架# DeepSeek# DeepSeek实用集成# 项目框架
SQLBot 一款基于大语言模型和 RAG(检索增强生成)的智能问数系统。借助 SQLBot,用户可以实现数据的即问即答,快速提炼获取所需的数据信息及可视化图表,并且支持进一步开展智能分析。 0160 项目框架# SQLBot# 项目框架
MindSearch MindSearch是一款由上海人工智能实验室联合研发的开源AI搜索引擎框架,旨在通过模仿人类的思维过程,高效地处理复杂信息搜集与整合任务。 0150 项目框架# MindSearch# 项目框架
Diffutoon Diffutoon 是一种基于扩散模型的高分辨率可编辑卡通着色技术,其核心功能是将真实视频转换为动漫风格,同时保持内容的一致性和高质量。 0150 项目框架# Diffutoon# 项目框架
Xinference Xinference 是一个功能强大且功能全面的分布式推理框架,旨在简化大语言模型(LLM)、语音识别、多模态模型等多种AI模型的推理任务。 0150 项目框架# Xinference# 项目框架
PPTist PPTist 是一个基于 Web 的演示文稿(幻灯片)应用,旨在为用户提供类似于 Microsoft Office PowerPoint 的功能。 0150 项目框架# ai ppt# AiPPT# ppt
500-AI-Agents-Projects AI Agent案例集合。收录了 500 多个 AI Agent 项目和应用案例,涵盖医疗、金融、教育、零售等多个行业,每个案例都配有详细说明和开源代码链接,便于开发者参考和学习 。 0150 项目框架# 项目框架
lmsysorg LMSYS Org是一个专注于大规模人工智能模型研究与开放协作的非营利组织,提供了丰富的资源、工具和社区服务,旨在促进学术界与工业界的合作,降低大模型技术的使用门槛。 0150 项目框架# lmsysorg# 项目框架
OmniHuman OmniHuman 是字节跳动研发的多模态数字人生成模型,能够同时接受文本、图像、音频和姿态等多种条件,实现从单张照片生成全身动态视频的功能。 0150 项目框架# OmniHuman# 项目框架
FireRedTTS FireRedTTS是一款由小红书技术团队开发的基于大语言模型(LLM)的语音合成系统,旨在为用户提供高效、多样化的语音生成服务。 0140 项目框架# FireRedTTS# 项目框架