MiniMind 是一个开源的大语言模型(LLM)项目,旨在从零开始,以极低的成本(仅需3块钱)和极短的时间(2小时)训练出一个轻量级的语言模型。该项目由开发者 Jingyao Gong 发起,旨在降低大模型的学习门槛,让更多人能够从零开始训练和理解大模型的原理。
- MiniMind官网入口网址:https://jingyaogong.github.io/minimind/
- MiniMind开源项目地址:https://github.com/jingyaogong/minimind
MiniMind 的核心特点是其极小的模型体积,最小模型体积仅为 GPT-3 的 1/7000,适合个人 GPU 快速训练。项目提供了完整的训练流程,包括预训练、监督微调(SFT)、LoRA 微调、强化学习(RLHF)等全过程代码,并且所有代码均从零开始用 PyTorch 重构,不依赖第三方库。
MiniMind 提供了多种模型版本,包括 MiniMind2 系列和 MiniMind-V(多模态扩展),支持多种训练和推理框架,如 llama.cpp、vllm、ollama 等。项目还提供了丰富的数据集和训练脚本,支持从零开始训练模型,并提供了详细的训练和评估工具。
MiniMind 的目标是推动 AI 社区的进步,让更多人能够理解和参与大模型的开发与训练。通过 MiniMind,用户可以体验从零开始训练一个语言模型的全过程,感受创造的乐趣。
数据统计
数据评估
关于MiniMind特别声明
本站千牛导航提供的MiniMind都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由千牛导航实际控制,在2025年10月27日 上午10:57收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,千牛导航不承担任何责任。
相关导航
知识库大模型,智能客服,智能问答,AI写作
SadTalker
SadTalker 是一个基于单张图像和音频生成说话人脸视频的模型,其核心功能是通过音频输入使静态图片中的图像动起来,并生成说话的虚拟人物。
元象大模型 XChat
元象大模型XChat是一款由元象科技自主研发的高性能通用人工智能大模型,旨在降低开发门槛与推理成本,满足多任务需求。
MiracleVision奇想智能
美图自研,一款懂美学的AI视觉大模型
学而思九章大模型(MathGPT)
学而思九章大模型(MathGPT)是好未来教育集团自主研发的一款专注于数学问题解决和教学的人工智能应用。
中国大模型列表
全面收集有明确来源的大模型情况
通义千问
阿里云自主研发的大语言模型
讯飞星辰MaaS平台
讯飞星辰MaaS平台是科大讯飞推出的一款一站式大模型定制精调平台,旨在为开发者和企业用户提供低门槛、全栈式的大模型应用开发服务。
暂无评论...

