[学习交流] 【上海校区】pycaffe生成solver文件并运行

使用pycaffe生成solver文件
# 如何利用pycaffe 生成 solver 文件

from caffe.proto import caffe_pb2

s = caffe_pb2.SolverParameter() # 封装了 solver文件的类

# 定义solver文件的参数
s.train_net = "train.prototxt" # 要训练的网络
s.test_net.append('test.prototxt') # 定义测试网络

s.test_interval = 100 # 训练多长时间测试一次
s.test_iter.append(10) #　测试迭代数，
# 例如：有10000个测试样本，batch_size设为32，
# 那么就需要迭代 10000/32=313次才完整地测试完一次，所以设置test_iter为313。

s.max_iter = 1000 # 最大迭代次数

s.base_lr = 0.1 # 基础学习率

s.weight_decay = 5e-4 # 定义学习率衰减率

s.lr_policy = 'step' # 定义学习率更新的方式

s.display = 10 # 定义打印网络的间隔

s.snapshot = 10 # 定义 caffemodel 存储的间隔

s.snapshot_prefix = 'model' # 定义caffemodel存放的路径，这里指的是前缀，前面可以加路径

s.type = 'SGD' # 网络优化类别

s.solver_mode = caffe_pb2.SolverParameter.GPU # 采用 gpu 还是 cpu

# 最后保存 solver 文件
with open("net/s.prototxt", 'w') as f: #　保存sovler文件
f.write(str(s))

lr_prolicy参数说明：

fixed: 保持base_lr不变；
step: step: 如果设置为step，则需要设置一个stepsize，返回base_lr * gamma ^ (floor(iter / stepsize))，其中iter表示当前的迭代次数；
exp: 返回base_lr * gamma ^ iter，iter为当前的迭代次数；
inv: 如何设置为inv，还需要设置一个power，返回base_lr * (1 + gamma * iter) ^ (- power)；
multistep: 如果设置为multistep，则还需要设置一个stepvalue，这个参数和step相似，step是均匀等间隔变化，而multistep则是根据stepvalue值变化；
stepvalue参数说明：

poly: 学习率进行多项式误差，返回base_lr (1 - iter/max_iter) ^ (power)；
sigmoid: 学习率进行sigmod衰减，返回base_lr ( 1/(1 + exp(-gamma * (iter - stepsize))))。
运行solver文件
import caffe

# 只需指定 solver 文件的路径即可
solver = caffe.SGDSolver("/data/cnn_net/lenet/lenet_solver.prototxt")

solver.solve()

不二晨 · 不二晨

奈斯

帐号		自动登录	找回密码
密码			加入黑马

[学习交流] 【上海校区】pycaffe生成solver文件并运行

1 个回复