使用pycaffe生成solver文件
# 如何利用pycaffe 生成 solver 文件
from caffe.proto import caffe_pb2
s = caffe_pb2.SolverParameter() # 封装了 solver文件的类
# 定义solver文件的参数
s.train_net = "train.prototxt" # 要训练的网络
s.test_net.append('test.prototxt') # 定义测试网络
s.test_interval = 100 # 训练多长时间测试一次
s.test_iter.append(10) # 测试迭代数,
# 例如:有10000个测试样本,batch_size设为32,
# 那么就需要迭代 10000/32=313次才完整地测试完一次,所以设置test_iter为313。
s.max_iter = 1000 # 最大迭代次数
s.base_lr = 0.1 # 基础学习率
s.weight_decay = 5e-4 # 定义学习率 衰减率
s.lr_policy = 'step' # 定义学习率更新的方式
s.display = 10 # 定义打印网络的间隔
s.snapshot = 10 # 定义 caffemodel 存储的间隔
s.snapshot_prefix = 'model' # 定义caffemodel存放的路径,这里指的是前缀,前面可以加路径
s.type = 'SGD' # 网络优化 类别
s.solver_mode = caffe_pb2.SolverParameter.GPU # 采用 gpu 还是 cpu
# 最后保存 solver 文件
with open("net/s.prototxt", 'w') as f: # 保存sovler文件
f.write(str(s))
lr_prolicy参数说明:
fixed: 保持base_lr不变;
step: step: 如果设置为step,则需要设置一个stepsize,返回base_lr * gamma ^ (floor(iter / stepsize)),其中iter表示当前的迭代次数;
exp: 返回base_lr * gamma ^ iter,iter为当前的迭代次数;
inv: 如何设置为inv,还需要设置一个power,返回base_lr * (1 + gamma * iter) ^ (- power);
multistep: 如果设置为multistep,则还需要设置一个stepvalue,这个参数和step相似,step是均匀等间隔变化,而multistep则是根据stepvalue值变化;
stepvalue参数说明:
poly: 学习率进行多项式误差,返回base_lr (1 - iter/max_iter) ^ (power);
sigmoid: 学习率进行sigmod衰减,返回base_lr ( 1/(1 + exp(-gamma * (iter - stepsize))))。
运行solver文件
import caffe
# 只需指定 solver 文件的路径 即可
solver = caffe.SGDSolver("/data/cnn_net/lenet/lenet_solver.prototxt")
solver.solve()
|
|