A股上市公司传智教育(股票代码 003032)旗下技术交流社区北京昌平校区

 找回密码
 加入黑马

QQ登录

只需一步,快速开始

使用pycaffe生成solver文件
# 如何利用pycaffe 生成 solver 文件

from caffe.proto import caffe_pb2

s = caffe_pb2.SolverParameter() # 封装了 solver文件的类

# 定义solver文件的参数
s.train_net = "train.prototxt" # 要训练的网络
s.test_net.append('test.prototxt') # 定义测试网络

s.test_interval = 100 # 训练多长时间测试一次
s.test_iter.append(10) # 测试迭代数,
# 例如:有10000个测试样本,batch_size设为32,
# 那么就需要迭代 10000/32=313次才完整地测试完一次,所以设置test_iter为313。

s.max_iter = 1000 # 最大迭代次数

s.base_lr = 0.1 # 基础学习率

s.weight_decay = 5e-4 # 定义学习率 衰减率

s.lr_policy = 'step' # 定义学习率更新的方式

s.display = 10 # 定义打印网络的间隔

s.snapshot = 10 # 定义 caffemodel 存储的间隔

s.snapshot_prefix = 'model' # 定义caffemodel存放的路径,这里指的是前缀,前面可以加路径

s.type = 'SGD' # 网络优化 类别

s.solver_mode = caffe_pb2.SolverParameter.GPU # 采用 gpu 还是 cpu

# 最后保存 solver 文件
with open("net/s.prototxt", 'w') as f: # 保存sovler文件
    f.write(str(s))

lr_prolicy参数说明:

fixed: 保持base_lr不变;
step: step: 如果设置为step,则需要设置一个stepsize,返回base_lr * gamma ^ (floor(iter / stepsize)),其中iter表示当前的迭代次数;
exp: 返回base_lr * gamma ^ iter,iter为当前的迭代次数;
inv: 如何设置为inv,还需要设置一个power,返回base_lr * (1 + gamma * iter) ^ (- power);
multistep: 如果设置为multistep,则还需要设置一个stepvalue,这个参数和step相似,step是均匀等间隔变化,而multistep则是根据stepvalue值变化;
stepvalue参数说明:

poly: 学习率进行多项式误差,返回base_lr (1 - iter/max_iter) ^ (power);
sigmoid: 学习率进行sigmod衰减,返回base_lr ( 1/(1 + exp(-gamma * (iter - stepsize))))。
运行solver文件
import caffe

# 只需指定 solver 文件的路径 即可
solver = caffe.SGDSolver("/data/cnn_net/lenet/lenet_solver.prototxt")

solver.solve()


1 个回复

倒序浏览
奈斯
回复 使用道具 举报
您需要登录后才可以回帖 登录 | 加入黑马