LLaMAFactory各参数详解
1. 模型与数据配置 参数/选项 详细说明 模型名称或路径 - 作用:指定要微调的基座模型。可以是 Hugging Face 上的模型标识符(如 meta-llama/Llama-2-7b-chat-hf),也可以是本地模型文件夹的路径。 - 注意:需要确保 LLaMA Factory 支持该模型架构,并且你有权限访问该模型。 适配器名称或路径 - 作用:如果之前进行过 LoRA 微调,可以在这里加载已有的 LoRA 适配器权重,用于继续训练或进行推理。 微调方法 - 作用:选择核心的微调策略。 - Full:全参数微调。消耗资源巨大,通常只在资源充足且需要最大程度改变模型时使用。 - Freeze:冻结微调。只训练模型的部分层(如最后几层),其余层参数冻结。是一种轻量级方法。 - LoRA:最常用。在原始模型旁增加低秩适配器,只训练这些小的适配器参数,极大减少显存和计算需求。 - QLoRA:LoRA 的量化版本。将基座模型以 4-bit...
Jupyter的缩写启动方式
实现方法找到Python Scripts文件夹(jupyter.exe 一般在这里) 1C:\Program Files\Python310\Scripts 或者 1C:\Users\你的用户名\AppData\Local\Programs\Python\Python310\Scripts 需要确保的是,这个文件夹在系统环境变量PATH里 在该目录下创建缩写.bat(下以jnb.bat为例),内容是 12@echo offjupyter notebook %* 随后启动jupyter notebook时直接输入jnb即可。 原理原理也很简单,执行bat里的命令时,默认会把要执行的命令显示到终端上,echo off 是取消命令的回显,@的作用是将echo off这行命令的回显也取消掉,%*是用来接受参数(jnb test.ipynb=jupyter notebook test.ipynb),所以运行时会执行”jupyter notebook %*”的命令,等同于在终端上输入了jupyter notebook。 破案了,直接配vscode+jupyter更简单
Jupyter7下的翻译问题的解决
Problemjnb更新到7版本后,不少nbextension也随之失效,其中当然包括nbtranslate, 尽管jnb7是基于jlab的,有着jlab的扩展支持,但其中也没有翻译方面的扩展。 但不得不面对的是,不少ipynb是英文版本的,有些时候必然会造成困扰 Solution提升英语水平,写一个python脚本,亦或者降级到jnb6() 大模型时代当然要使用大模型,可以直接将文件喂给大模型,但是不氪金会受到点限制寻找solution时,逛到jnb的侧栏ai agent,感觉很是方便,而且模型能自己选择,缺点是不氪金一个月只能对话50次(可以换着号来用),但是只用来翻译够用了 下面呈现方法 1pip install runcell 在查看(View)-右侧边栏(Right Sidebar)-show打开,用github/google登录即可 破案了,直接vscode+jupyter+copilot完事
排序二分位运算双指针
排序去重排序vector + sort + unique 12sort(a.begin(), a.end());a.erase((a.begin(), a.end()), a.end); 桶排序当需要排序的值有许多重复值时,即数组大小远大于数据的大小时 12345678for (int i = 1; i <= n; i++){ cin >> x; a[x]++;}for (int i = 1; i <= n; i++) for (int j = 0; j < a[i]; j++) cout << i << ' '; 结构体排序当一个元素有多个值且明确要求有先后顺序时在结构体里重载比较运算符,自定义sort 1234567891011121314struct book{ int a, b, c; bool operator>(const book &v) const { if (a ==...
CS61B学习记录
java基础知识在java中,只有八种基本类型(byte,short,int,double,float,long,char,boolean)在调用时是值传递的调用,其他类型均为地址传递(引用)所以,创建一个string类型的数组时,存放的是每个string类型的地址创建一个数组的方法 123x = new int[3];y = new int[]{1,2,3,4,5};int [] z = {9,213,41,12}; 类可以进行嵌套。如SLList里嵌套了IntNode类,IntNode只是SLList的一个子功能泛型实例化不能直接对数组使用,而要通过 1items = (T[]) new Object[9]; 语句实现 IntList123456789101112131415161718public class IntList{ public int first; public IntList rest; public static void main(String[] args) { ...





