Frederik Kunstner

Cited by

	All	Since 2019
Citations	516	512
h-index	7	7
i10-index	6	6

140

105

20182019202020212022202320243 19 52 99 100 139 101

Public access

View all

4 articles

0 articles

available

not available

Based on funding mandates

Co-authors

Mark SchmidtAssociate Professor of Computer Science, University of British ColumbiaVerified email at cs.ubc.ca
Philipp HennigUniversity of TübingenVerified email at uni-tuebingen.de
Lukas BallesAleph AlphaVerified email at aleph-alpha.com
Simon Lacoste-JulienAssociate Professor - Canada CIFAR AI Chair, University of Montreal / MilaVerified email at iro.umontreal.ca
Felix DangelPostdoc at the Vector Institute, TorontoVerified email at vectorinstitute.ai
Jonathan Wilder LavingtonPhD Student, University of British ColumbiaVerified email at cs.ubc.ca
Sharan VaswaniSimon Fraser UniversityVerified email at sfu.ca
Issam H. LaradjiStaff Research Scientist at ServiceNow & Adjunct Professor at University of British ColumbiaVerified email at servicenow.com
Aaron MishkinPhD Student, Stanford UniversityVerified email at cs.stanford.edu
Mohammad Emtiyaz KhanCenter for Advanced Intelligence Project (AIP), RIKEN, TokyoVerified email at postman.riken.jp
Raunak KumarCornell UniversityVerified email at cornell.edu
Si Yi MengCornell UniversityVerified email at cs.cornell.edu
Alberto BiettiFlatiron Institute, Simons FoundationVerified email at nyu.edu
Victor Sanches PortellaPhD candidate in Comptuer Science, University of British ColumbiaVerified email at cs.ubc.ca
Nicholas J. A. HarveyProfessor of Computer Science, University of British ColumbiaVerified email at cs.ubc.ca
Rémi Le PriolPhD from MILA, University of MontréalVerified email at umontreal.ca
Damien ScieurSamsung - SAIL MontréalVerified email at samsung.com
Robert Mansel GowerResearch Scientist, Center for Computational Mathematics, Flatiron Institute, Simons FoundationVerified email at flatironinstitute.org
Didrik NielsenHead of ML @ twig.energy
Martin JaggiEPFLVerified email at epfl.ch

Frederik Kunstner

University of British Columbia

Verified email at cs.ubc.ca - Homepage


Title Sort by citations Sort by year Sort by title	Cited by Cited by	Year
Limitations of the empirical Fisher approximation for natural gradient descent F Kunstner, L Balles, P Hennig Advances in Neural Information Processing Systems 32, 4158--4169, 2019	209	2019
BackPACK: Packing more into Backprop F Dangel, F Kunstner, P Hennig International Conference on Learning Representations, 2020	110	2020
Slang: Fast structured covariance approximations for bayesian deep learning with natural gradient A Mishkin, F Kunstner, D Nielsen, M Schmidt, ME Khan Advances in Neural Information Processing Systems 31, 6248--6258, 2018	69	2018
Noise is not the main factor behind the gap between sgd and adam on transformers, but sign descent might be F Kunstner, J Chen, JW Lavington, M Schmidt International Conference on Learning Representations, 5, 2023	41*	2023
Adaptive gradient methods converge faster with over-parameterization (but you should do a line-search) S Vaswani, I Laradji, F Kunstner, SY Meng, M Schmidt, S Lacoste-Julien arXiv preprint arXiv:2006.06835, 2020	39*	2020
Homeomorphic-Invariance of EM: Non-Asymptotic Convergence in KL Divergence for Exponential Families via Mirror Descent F Kunstner, R Kumar, M Schmidt International Conference on Artificial Intelligence and Statistics 130, 3295 …, 2021	31	2021
Fully Quantized Distributed Gradient Descent F Künstner, SU Stich, M Jaggi Technical report, EPFL, 2017	8	2017
Heavy-tailed class imbalance and why adam outperforms gradient descent on language models F Kunstner, R Yadav, A Milligan, M Schmidt, A Bietti arXiv preprint arXiv:2402.19449, 2024	4	2024
Searching for optimal per-coordinate step-sizes with multidimensional backtracking F Kunstner, V Sanches Portella, M Schmidt, N Harvey Advances in Neural Information Processing Systems 36, 2024	3	2024
Convergence Rates for the MAP of an Exponential Family and Stochastic Mirror Descent--an Open Problem RL Priol, F Kunstner, D Scieur, S Lacoste-Julien arXiv preprint arXiv:2111.06826, 2021	2	2021
Variance Reduced Model Based Methods: New rates and adaptive step sizes RM Gower, F Kunstner, M Schmidt OPT 2023: Optimization for Machine Learning, 2023		2023

The system can't perform the operation now. Try again later.

Articles 1–11

Citations per year

Duplicate citations

Merged citations

Add co-authorsCo-authors

Follow

Cited by

Co-authors