1. hugging face网站简介
抱脸相当于Ai界的GitHub,里面的模型都是开源免费的,非常适合AI开发者使用,使用前应先安装transformer库。
网站:https://huggingface.co/
1 | pip install transformers |
2. fine-tunning简易教程(以新闻分类为例)
需要在huggingface网站中寻找合适于自己任务的模型,下载下来,默认的下载路径为:
- 1)使用 Windows 模型保存的路径在 C:\Users[用户名].cache\torch\transformers\ 目录下,根据模型的不同下载的东西也不相同
- 2)使用 Linux 模型保存的路径在 ~/.cache/torch/transformers/ 目录下
通过tokenizer可以将文本转换为模型能理解的数字,其中checkpoint是我们找好的模型的名字:
1 | from transformers import AutoTokenizer |
模型的训练也是从选好的模型的checkpoint开始训练的
1 | from transformers import AutoModelForSequenceClassification, TrainingArguments, Trainer |