分享
点赞 7
评论 0
minimind 19357星
从零开始训练小型语言模型 🚀🚀 「大模型」3小时完全从0训练26M的小参数GPT!🌏
项目来源:

项目简介


这不仅是一个微型语言模型的实现,更是一份入门 LLM 的教程,旨在降低学习和上手 LLM 的门槛 。它提供了从数据预处理到模型训练、微调和推理的全流程代码和教程。最小模型仅 0.02B 参数,可在普通 GPU 上轻松运行。

其他