Tor Lattimore

Citée par

	Toutes	Depuis 2019
Citations	6480	6016
indice h	36	34
indice i10	67	62

1600

800

400

1200

20132014201520162017201820192020202120222023202421 26 53 56 95 179 343 766 1219 1445 1574 666

Accès public

Tout afficher

21 articles

0 article

disponibles

non disponibles

Sur la base des exigences liées au financement

Coauteurs

Csaba SzepesvariDeepMind & University of AlbertaAdresse e-mail validée de cs.ualberta.ca
Marcus HutterResearcher@DeepMind & Professor at ANUAdresse e-mail validée de anu.edu.au
Botao HaoDeepmindAdresse e-mail validée de google.com
Andras GyorgyDeepMindAdresse e-mail validée de google.com
Laurent OrseauResearch Scientist at Google DeepMindAdresse e-mail validée de google.com
Branislav KvetonAmazonAdresse e-mail validée de amazon.com
Eren SezenerDeepMindAdresse e-mail validée de google.com
Ian OsbandOpenAIAdresse e-mail validée de openai.com
Christoph DannResearch Scientist, GoogleAdresse e-mail validée de google.com
Emma BrunskillAssociate Professor of Computer Science, Stanford UniversityAdresse e-mail validée de cs.stanford.edu
Julian ZimmertGoogle ResearchAdresse e-mail validée de google.com
Mengdi WangCenter for Statistics & Machine Learning, ECE, Princeton UniversityAdresse e-mail validée de princeton.edu
Joel VenessGoogle DeepMindAdresse e-mail validée de google.com
Benjamin Van RoyStanford UniversityAdresse e-mail validée de stanford.edu
Satinder SinghGoogle DeepMind / U. of MichiganAdresse e-mail validée de umich.edu
Johannes KirschnerSwiss Data Science Center, ETH ZurichAdresse e-mail validée de sdsc.ethz.ch
Dale SchuurmansUniversity of Alberta, Google DeepMindAdresse e-mail validée de cs.ualberta.ca
Avishkar BhoopchandResearch Engineer, DeepMindAdresse e-mail validée de google.com
Agnieszka Grabska BarwińskaDeepMindAdresse e-mail validée de google.com
Peter TothAI ResearchAdresse e-mail validée de techcombank.com.vn

Suivre

Tor Lattimore

DeepMind

Adresse e-mail validée de google.com - Page d'accueil

machine learning learning theory reinforcement learning


Titre Trier par citations Trier par année Trier par titre	Citée par Citée par	Année
Bandit algorithms T Lattimore, C Szepesvári Cambridge University Press, 2020	2609	2020
Unifying PAC and regret: Uniform PAC bounds for episodic reinforcement learning C Dann, T Lattimore, E Brunskill Advances in Neural Information Processing Systems 30, 2017	300	2017
Causal bandits: Learning good interventions via causal inference F Lattimore, T Lattimore, MD Reid Advances in neural information processing systems 29, 2016	256*	2016
Degenerate feedback loops in recommender systems R Jiang, S Chiappa, T Lattimore, A György, P Kohli Proceedings of the 2019 AAAI/ACM Conference on AI, Ethics, and Society, 383-390, 2019	214	2019
Learning with good feature representations in bandits and in rl with a generative model T Lattimore, C Szepesvari, G Weisz International conference on machine learning, 5662-5670, 2020	178	2020
Behaviour suite for reinforcement learning I Osband, Y Doron, M Hessel, J Aslanides, E Sezener, A Saraiva, ... arXiv preprint arXiv:1908.03568, 2019	175	2019
PAC bounds for discounted MDPs T Lattimore, M Hutter Algorithmic Learning Theory: 23rd International Conference, ALT 2012, Lyon …, 2012	139	2012
The end of optimism? an asymptotic analysis of finite-armed linear bandits T Lattimore, C Szepesvari Artificial Intelligence and Statistics, 728-737, 2017	129	2017
Conservative bandits Y Wu, R Shariff, T Lattimore, C Szepesvári International Conference on Machine Learning, 1254-1262, 2016	120	2016
On explore-then-commit strategies A Garivier, T Lattimore, E Kaufmann Advances in Neural Information Processing Systems 29, 2016	112	2016
A geometric perspective on optimal representations for reinforcement learning M Bellemare, W Dabney, R Dadashi, A Ali Taiga, PS Castro, N Le Roux, ... Advances in neural information processing systems 32, 2019	95	2019
Model selection in contextual stochastic bandit problems A Pacchiano, M Phan, Y Abbasi Yadkori, A Rao, J Zimmert, T Lattimore, ... Advances in Neural Information Processing Systems 33, 10328-10337, 2020	91	2020
Garbage in, reward out: Bootstrapping exploration in multi-armed bandits B Kveton, C Szepesvari, S Vaswani, Z Wen, T Lattimore, M Ghavamzadeh International Conference on Machine Learning, 3601-3610, 2019	72	2019
Toprank: A practical algorithm for online stochastic ranking T Lattimore, B Kveton, S Li, C Szepesvari Advances in Neural Information Processing Systems 31, 2018	71	2018
Near-optimal PAC bounds for discounted MDPs T Lattimore, M Hutter Theoretical Computer Science 558, 125-143, 2014	68	2014
The sample-complexity of general reinforcement learning T Lattimore, M Hutter, P Sunehag International Conference on Machine Learning, 28-36, 2013	68	2013
Linear bandits with stochastic delayed feedback C Vernade, A Carpentier, T Lattimore, G Zappella, B Ermis, M Brueckner International Conference on Machine Learning, 9712-9721, 2020	67	2020
Bounded Regret for Finite-Armed Structured Bandits T Lattimore, R Munos	67	2014
Adaptive exploration in linear contextual bandit B Hao, T Lattimore, C Szepesvari International Conference on Artificial Intelligence and Statistics, 3536-3545, 2020	60	2020
An information-theoretic approach to minimax regret in partial monitoring T Lattimore, C Szepesvári Conference on Learning Theory, 2111-2139, 2019	59	2019

Le système ne peut pas réaliser cette opération maintenant. Veuillez réessayer plus tard.

Articles 1–20

Nombre de citations par an

Citations en double

Citations fusionnées

Ajouter les coauteursCoauteurs

Suivre

Citée par

Coauteurs