LangGPT LangGPT 项目旨在以结构化、模板化的方式编写高质量 ChatGPT prompt,你可以将其视为一种面向大模型的 prompt 编程语言。 040 项目框架# LangGPT# 提示词# 项目框架
Shimmy Shimmy 是一款轻量级开源工具,专为本地 AI 推理设计,提供了与 OpenAI API 完全兼容的接口,使开发者能够在本地环境中运行大模型,而无需依赖云端服务。 030 项目框架# Shimmy# 项目框架
MindSearch MindSearch是一款由上海人工智能实验室联合研发的开源AI搜索引擎框架,旨在通过模仿人类的思维过程,高效地处理复杂信息搜集与整合任务。 020 项目框架# MindSearch# 项目框架
Diffutoon Diffutoon 是一种基于扩散模型的高分辨率可编辑卡通着色技术,其核心功能是将真实视频转换为动漫风格,同时保持内容的一致性和高质量。 020 项目框架# Diffutoon# 项目框架
AniPortrait AniPortrait 是腾讯游戏智迹团队开发的一款创新的音频驱动肖像动画生成框架,能够通过音频和参考肖像图像生成高质量的动态视频。 020 项目框架# AniPortrait# 项目框架
MotionAgent MotionAgent是一个能将用户创造的剧本生成视频的深度学习模型工具。用户通过我们提供的工具组合,进行剧本创作、剧照生成、图片/视频生成、背景音乐谱写等工作。 020 项目框架# MotionAgent# 阿里ai# 项目框架
EmotiVoice易魔声 EmotiVoice是一个强大的开源TTS引擎,完全免费,支持中英文双语,包含2000多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。 020 项目框架# EmotiVoice# 易魔声# 项目框架
PoloAPI PoloAPI 是一个专注于大模型 API 聚合服务的平台,旨在帮助开发者和企业快速接入和使用多种 AI 模型,如 Claude、OpenAI、Gemini 等。 020 项目框架# API# PoloAPI# 项目框架
Gemini CLI Gemini CLI 是一个开源的 AI 代理工具,由 Google 开发,旨在将 Gemini 模型的强大功能直接集成到开发者的终端中 。 020 项目框架# Gemini CLI# 项目框架
MCP Feedback Enhanced MCP Feedback Enhanced 是一个基于 Model Context Protocol(MCP)的反馈驱动开发工具,旨在通过用户确认而非推测操作,优化AI交互流程,提升开发效率。 020 项目框架# 项目框架
AgenticSeek 一个完全本地运行的 AI 助手,旨在替代传统云端 AI 服务,提供多种功能,包括智能网页浏览、代码编写、任务规划、语音交互等,支持多种编程语言和多语言支持。 020 项目框架# AgenticSeek# 项目框架
browser-use Browser Use 是一款专为大语言模型设计的智能浏览器工具。它是将 AI 智能体与浏览器连接起来的最简单方式,通过提供强大且简单的浏览器自动化接口,让 AI 智能体能够访问各类网站。 020 项目框架# ai浏览器自动化# browser-use# 浏览器自动化
GPT-SoVITS GPT-SoVITS 是一款创新的开源声音克隆工具,它将 GPT 模型与 SoVITS 技术相结合,能够在样本数据极少的情况下,实现高质量的语音克隆和文本到语音转换(TTS)。 020 项目框架# GPT-SoVITS# 项目框架
Edge-TTS Edge-TTS 是一个基于微软 Azure 文本转语音(TTS)功能的 Python 库,旨在为开发者提供简单、高效、免费的文本转语音解决方案。 020 项目框架# Edge-TTS# 项目框架
opencode opencode 是一个专为终端设计的 AI 编程代理(AI coding agent),旨在提供类似 Claude Code 的功能。支持 OpenAI、Google、Anthropic 等模型,甚 020 项目框架# opencode# 项目框架
PPTist PPTist 是一个基于 Web 的演示文稿(幻灯片)应用,旨在为用户提供类似于 Microsoft Office PowerPoint 的功能。 020 项目框架# ai ppt# AiPPT# ppt
LeRobot LeRobot 是由 Hugging Face 推出的一个开源机器人项目,旨在通过提供模型、数据集和工具,降低机器人开发的门槛,使更多人能够参与和受益于机器人技术的发展。 020 项目框架# LeRobot# 项目框架
LlamaIndex 一个用于构建 LLM(大型语言模型)应用的数据框架,提供了一套工具和框架,帮助开发者将私有数据与 LLM 结合使用,以增强知识生成和推理能力。 020 项目框架# LlamaIndex# 项目框架
Youtu-Agent Youtu-Agent 是腾讯优图实验室于 2025 年 9 月 2 日正式开源的智能体构建框架。是一个灵活、高性能的框架,用于构建、运行和评估自主智能体。 020 项目框架# Youtu-Agent# 项目框架
Perplexica Perplexica 是一个开源的 AI 驱动搜索工具,旨在深入互联网以找到答案。它基于 Perplexity AI,是一个开源的替代方案,不仅搜索网页,还能理解用户的问题。 020 项目框架# Perplexica# 项目框架
UI-TARS 一个开源的多模态代理模型,基于强大的视觉语言模型,能够有效执行虚拟世界中的多样化任务。具备 GUI、游戏、代码和工具使用等增强能力,能够无缝集成多种能力以完成复杂任务。 020 项目框架# UI-TARS# 项目框架
Stagehand Stagehand 是一个专注于网页自动化和 AI 浏览器控制的框架。它基于 Playwright 构建,提供自然语言控制的 API,用于实现网页自动化任务,如网页浏览、数据提取和操作等。 020 项目框架# ai浏览器自动化# Stagehand# 浏览器自动化
Windows‑Use Windows-Use 是一个开源工具,旨在桥接AI智能体(如大型语言模型)与Windows操作系统,实现无需人工干预的自动化操作。 020 项目框架# Windows‑Use# 自动化# 项目框架
FireRedTTS FireRedTTS是一款由小红书技术团队开发的基于大语言模型(LLM)的语音合成系统,旨在为用户提供高效、多样化的语音生成服务。 010 项目框架# FireRedTTS# 项目框架
Midscene.js Midscene.js 是一个基于人工智能(AI)技术的自动化 SDK,旨在简化用户界面(UI)自动化测试流程,提高测试效率和准确性。 010 项目框架# Midscene.js# 项目框架
coze-studio Coze Studio 是由字节跳动开发并开源的一站式 AI Agent 开发工具,旨在为开发者提供从开发到部署的全方位支持,帮助他们快速构建和调试智能体、应用和工作流 。 010 项目框架# coze-studio# 项目框架
小智 AI 聊天机器人 小智 AI 聊天机器人是一款基于开源硬件和开源软件的智能对话设备,旨在帮助用户入门 AI 硬件开发和 AI 模型应用。 010 项目框架# 小智 AI 聊天机器人# 小智AI# 聊天机器人
Xinference Xinference 是一个功能强大且功能全面的分布式推理框架,旨在简化大语言模型(LLM)、语音识别、多模态模型等多种AI模型的推理任务。 010 项目框架# Xinference# 项目框架
PaddleSpeech 百度飞桨(PaddlePaddle)平台上的一个开源语音处理工具包,旨在为语音识别、语音合成、语音翻译、语音识别、语音分类、语音标点恢复、语音情感分析等任务提供全面的解决方案。 010 项目框架# PaddleSpeech# 百度# 百度飞桨