NanoGPT 是一个基于 PyTorch 和 Transformers 的轻量级 GPT 软件包,它旨在提供一个简单易用的基于 Transformer 的语言模型。NanoGPT 软件包具有以下特点:
- 使用 PyTorch 和 Transformers 实现,易于使用和自定义。
- 极小的模型尺寸,仅使用 4 层 Transformer 和 12M 个参数。
- 可以在普通的 CPU 上快速运行,也可以在 GPU 上进行深度学习加速。
- 预先训练的语言模型,可以直接用于文本生成和语言建模等自然语言处理任务。
这个软件包已经在自然语言生成、文本自动补全、命名实体识别、情感分析、机器翻译和语义文本搜索等任务中得到了广泛应用。
以上解释来自ChatGPT。
nanoGPT项目:https://github.com/karpathy/nanoGPT
教程参考jack Cui的小白视频。https://www.bilibili.com/video/BV1wP41197uW/?spm_id_from=333.999.0.0&vd_source=a8cb056b6a872c57e91579ca5f18aac1
tiandi训练的时候,没有排除七言绝句,因此效果和视频不一样。
文章评分1次,平均分5.0:★★★★★
能的
哈哈, 也在研究了。。。这货帮助写代码真的太强了。