Second-order optimization method for Deep Neural Network

Codes for ECE 236C to fullfill the course requriements.

To reproduce the results in the report, for Conjugate Graident (CG) solver, please run:

CUDA_VISIBLE_DEVICES=$GPU_ID python main.py --dir DIR --epoch 300 --lr_decay 300 --cuda --optim NewtonACR_CG --freq 1 --init 0.005 --step 1 --model CNN --N1 100 --bs 512 --rho 1 --mGPUs

For Gradient Descent (GD) solver of Trust Region problem, please run:

CUDA_VISIBLE_DEVICES=$GPU_ID python main.py --dir DIR --epoch 300 --lr_decay 80 --cuda --optim Newton --model CNN --freq 1 --init 0.05 --step 0.05 --bs 128 --decay 0 --momentum 0 --lr 0.1

OR

CUDA_VISIBLE_DEVICES=$GPU_ID python main.py --dir DIR --epoch 300 --lr_decay 80 --cuda --optim NewtonCR --model CNN --freq 1 --init 0.05 --step 0.05 --bs 128 --decay 0 --momentum 0 --lr 0.1

for Cubic Regularization problem.

Should you have any questions, please kindly contact me at [email protected]

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
models		models
.gitattributes		.gitattributes
ECE_236C_course_project_report _805227042_Pengrui.pdf		ECE_236C_course_project_report _805227042_Pengrui.pdf
README.md		README.md
cnn.py		cnn.py
main.py		main.py
mlp.py		mlp.py
newton_cg.py		newton_cg.py
newton_cr.py		newton_cr.py
optim.py		optim.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Second-order optimization method for Deep Neural Network

About

Uh oh!

Releases

Packages

Languages

quanpr/Second-order-method-for-Deep-Neural-Network

Folders and files

Latest commit

History

Repository files navigation

Second-order optimization method for Deep Neural Network

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages