Bedankt voor het vertrouwen het afgelopen jaar! Om jou te bedanken bieden we GRATIS verzending (in België) aan op alles gedurende de hele maand januari.
  • Afhalen na 1 uur in een winkel met voorraad
  • Gratis thuislevering in België vanaf € 30
  • Ruim aanbod met 7 miljoen producten
Bedankt voor het vertrouwen het afgelopen jaar! Om jou te bedanken bieden we GRATIS verzending (in België) aan op alles gedurende de hele maand januari.
  • Afhalen na 1 uur in een winkel met voorraad
  • Gratis thuislevering in België vanaf € 30
  • Ruim aanbod met 7 miljoen producten
  1. Boeken
  2. Bedrijf & Technologie
  3. Informatica
  4. AI
  5. Algorithms for Reinforcement Learning

Algorithms for Reinforcement Learning

Csaba Szepesvári
€ 32,45
+ 64 punten
Uitvoering
Levertermijn 1 à 4 weken
Eenvoudig bestellen
Veilig betalen
In januari gratis thuislevering in België (via bpost)
Gratis levering in je Standaard Boekhandel

Omschrijving

Reinforcement learning is a learning paradigm concerned with learning to control a system so as to maximize a numerical performance measure that expresses a long-term objective. What distinguishes reinforcement learning from supervised learning is that only partial feedback is given to the learner about the learner's predictions. Further, the predictions may have long term effects through influencing the future state of the controlled system. Thus, time plays a special role. The goal in reinforcement learning is to develop efficient learning algorithms, as well as to understand the algorithms' merits and limitations. Reinforcement learning is of great interest because of the large number of practical applications that it can be used to address, ranging from problems in artificial intelligence to operations research or control engineering. In this book, we focus on those algorithms of reinforcement learning that build on the powerful theory of dynamic programming. We give a fairly comprehensive catalog of learning problems, describe the core ideas, note a large number of state of the art algorithms, followed by the discussion of their theoretical properties and limitations. Table of Contents: Markov Decision Processes / Value Prediction Problems / Control / For Further Exploration

Specificaties

Betrokkenen

Auteur(s):
Uitgeverij:

Inhoud

Aantal bladzijden:
89
Taal:
Engels
Reeks:

Eigenschappen

Productcode (EAN):
9783031004230
Verschijningsdatum:
7/07/2010
Uitvoering:
Paperback
Formaat:
Trade paperback (VS)
Afmetingen:
190 mm x 235 mm
Gewicht:
195 g
Standaard Boekhandel

Alleen bij Standaard Boekhandel

+ 64 punten op je klantenkaart van Standaard Boekhandel
CADEAU

Onze must-reads: hét eindejaarsgeschenk

Vul een gat in iemands lectuur
CADEAU
GDABD Must-read
Standaard Boekhandel

Beoordelingen

We publiceren alleen reviews die voldoen aan de voorwaarden voor reviews. Bekijk onze voorwaarden voor reviews.