MiniMind 是一个开源的大语言模型(LLM)项目,旨在从零开始,以极低的成本(仅需3块钱)和极短的时间(2小时)训练出一个轻量级的语言模型。该项目由开发者 Jingyao Gong 发起,旨在降低大模型的学习门槛,让更多人能够从零开始训练和理解大模型的原理。
- MiniMind官网入口网址:https://jingyaogong.github.io/minimind/
- MiniMind开源项目地址:https://github.com/jingyaogong/minimind
MiniMind 的核心特点是其极小的模型体积,最小模型体积仅为 GPT-3 的 1/7000,适合个人 GPU 快速训练。项目提供了完整的训练流程,包括预训练、监督微调(SFT)、LoRA 微调、强化学习(RLHF)等全过程代码,并且所有代码均从零开始用 PyTorch 重构,不依赖第三方库。
MiniMind 提供了多种模型版本,包括 MiniMind2 系列和 MiniMind-V(多模态扩展),支持多种训练和推理框架,如 llama.cpp、vllm、ollama 等。项目还提供了丰富的数据集和训练脚本,支持从零开始训练模型,并提供了详细的训练和评估工具。
MiniMind 的目标是推动 AI 社区的进步,让更多人能够理解和参与大模型的开发与训练。通过 MiniMind,用户可以体验从零开始训练一个语言模型的全过程,感受创造的乐趣。
数据统计
数据评估
关于MiniMind特别声明
本站IP导航提供的MiniMind都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由IP导航实际控制,在2025年10月27日 上午10:57收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,IP导航不承担任何责任。
相关导航
整合了多种先进的人工智能模型,包括GLM系列、CodeGeeX、CogView等
怪兽AI知识库大模型
知识库大模型,智能客服,智能问答,AI写作
Hallo
Hallo 是一个由复旦大学(Fudan University)开发的开源项目,专注于音频驱动的视觉合成技术,特别是用于人像动画生成。
元象大模型 XChat
元象大模型XChat是一款由元象科技自主研发的高性能通用人工智能大模型,旨在降低开发门槛与推理成本,满足多任务需求。
Goku
Goku视频生成模型是由中国香港大学与字节跳动联合推出的一款AI视频生成工具,能够实现文本到视频、图像到视频以及文本到图像等多种生成方式。
学而思九章大模型(MathGPT)
学而思九章大模型(MathGPT)是好未来教育集团自主研发的一款专注于数学问题解决和教学的人工智能应用。
商汤商量拟人大模型
一款基于先进人工智能技术开发的对话型AI工具,旨在通过高度拟人化的交互体验,为用户提供丰富的情感陪伴、角色互动和多场景应用能力
Qwen大模型
阿里巴巴集团Qwen团队研发的大语言模型和大型多模态模型系列
暂无评论...

