500-AI-Agents-Projects AI Agent案例集合。收录了 500 多个 AI Agent 项目和应用案例,涵盖医疗、金融、教育、零售等多个行业,每个案例都配有详细说明和开源代码链接,便于开发者参考和学习 。 0340 项目框架# 项目框架
LangGraph LangGraph 是一个用于构建、管理和部署长运行、有状态代理(agents)的低级编排框架。它被广泛应用于需要构建复杂、可扩展、可持久化代理系统的场景。 0340 项目框架# LangGraph# 项目框架
awesome-cursorrules Awesome CursorRules 是一个精选的.cursorrules 文件集合,用于增强 Cursor AI 的代码生成功能。 0340 项目框架# awesome-cursorrules# 项目框架
DeepSeek实用集成 DeepSeek官方推出的一站式集成资源库,旨在帮助用户将DeepSeek AI能力无缝集成到各类应用中。 0340 项目框架# DeepSeek# DeepSeek实用集成# 项目框架
DeepFlow DeepFlow 是由云杉网络(Yunshan Networks)研发的 全栈可观测性平台,面向云原生、分布式系统以及 AI 应用,提供从底层网络到业务层的统一监控、追踪和性能剖析能力。 0340 项目框架# DeepFlow# 项目框架
PaddleSpeech 百度飞桨(PaddlePaddle)平台上的一个开源语音处理工具包,旨在为语音识别、语音合成、语音翻译、语音识别、语音分类、语音标点恢复、语音情感分析等任务提供全面的解决方案。 0330 项目框架# PaddleSpeech# 百度# 百度飞桨
Fish Speech Fish Speech 是一个由 Fish Audio 团队开发的文本转语音(TTS)技术,旨在利用先进的机器学习和深度学习技术将文字转换为自然流畅的语音输出。 0330 项目框架# Fish Speech# 项目框架
GPT-SoVITS GPT-SoVITS 是一款创新的开源声音克隆工具,它将 GPT 模型与 SoVITS 技术相结合,能够在样本数据极少的情况下,实现高质量的语音克隆和文本到语音转换(TTS)。 0330 项目框架# GPT-SoVITS# 项目框架
Edge-TTS Edge-TTS 是一个基于微软 Azure 文本转语音(TTS)功能的 Python 库,旨在为开发者提供简单、高效、免费的文本转语音解决方案。 0330 项目框架# Edge-TTS# 项目框架
Video-Analyzer 一个视频分析工具,结合了视觉模型(如Llama的11B视觉模型)和Whisper进行语音识别,通过提取关键帧并进行分析,生成视频内容的描述。 0330 项目框架# 项目框架
Unstract Unstract 是一款基于大语言模型(LLM)打造的无代码平台,专注于非结构化数据提取,旨在通过 LLM 能力消除非结构化数据相关的人工流程 0330 项目框架# Unstract# 项目框架
UI-TARS 一个开源的多模态代理模型,基于强大的视觉语言模型,能够有效执行虚拟世界中的多样化任务。具备 GUI、游戏、代码和工具使用等增强能力,能够无缝集成多种能力以完成复杂任务。 0330 项目框架# UI-TARS# 项目框架
PPTist PPTist 是一个基于 Web 的演示文稿(幻灯片)应用,旨在为用户提供类似于 Microsoft Office PowerPoint 的功能。 0320 项目框架# ai ppt# AiPPT# ppt
Youtu-Agent Youtu-Agent 是腾讯优图实验室于 2025 年 9 月 2 日正式开源的智能体构建框架。是一个灵活、高性能的框架,用于构建、运行和评估自主智能体。 0320 项目框架# Youtu-Agent# 项目框架
Xinference Xinference 是一个功能强大且功能全面的分布式推理框架,旨在简化大语言模型(LLM)、语音识别、多模态模型等多种AI模型的推理任务。 0310 项目框架# Xinference# 项目框架
SQLBot 一款基于大语言模型和 RAG(检索增强生成)的智能问数系统。借助 SQLBot,用户可以实现数据的即问即答,快速提炼获取所需的数据信息及可视化图表,并且支持进一步开展智能分析。 0310 项目框架# SQLBot# 项目框架
Gemini CLI Gemini CLI 是一个开源的 AI 代理工具,由 Google 开发,旨在将 Gemini 模型的强大功能直接集成到开发者的终端中 。 0300 项目框架# Gemini CLI# 项目框架
AniPortrait AniPortrait 是腾讯游戏智迹团队开发的一款创新的音频驱动肖像动画生成框架,能够通过音频和参考肖像图像生成高质量的动态视频。 0290 项目框架# AniPortrait# 项目框架
Midscene.js Midscene.js 是一个基于人工智能(AI)技术的自动化 SDK,旨在简化用户界面(UI)自动化测试流程,提高测试效率和准确性。 0280 项目框架# Midscene.js# 项目框架
MotionAgent MotionAgent是一个能将用户创造的剧本生成视频的深度学习模型工具。用户通过我们提供的工具组合,进行剧本创作、剧照生成、图片/视频生成、背景音乐谱写等工作。 0280 项目框架# MotionAgent# 阿里ai# 项目框架
EmotiVoice易魔声 EmotiVoice是一个强大的开源TTS引擎,完全免费,支持中英文双语,包含2000多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。 0270 项目框架# EmotiVoice# 易魔声# 项目框架
FireRedTTS FireRedTTS是一款由小红书技术团队开发的基于大语言模型(LLM)的语音合成系统,旨在为用户提供高效、多样化的语音生成服务。 0260 项目框架# FireRedTTS# 项目框架
MindSearch MindSearch是一款由上海人工智能实验室联合研发的开源AI搜索引擎框架,旨在通过模仿人类的思维过程,高效地处理复杂信息搜集与整合任务。 0260 项目框架# MindSearch# 项目框架
Diffutoon Diffutoon 是一种基于扩散模型的高分辨率可编辑卡通着色技术,其核心功能是将真实视频转换为动漫风格,同时保持内容的一致性和高质量。 0250 项目框架# Diffutoon# 项目框架