State–action–reward–state–action: historial de revisions

Filtra les revisionsAmpliaTanca

A la data:

Inverteix la selecció

Selecció de diferències: Marqueu els botons corresponents de les revisions per comparar i premeu Intro o el botó inferior. Llegenda: (act) = diferències amb la revisió actual, (prev) = diferències amb revisió anterior, m = edició menor.

actprev 20:5920:59, 1 jul 2024‎ 2003:e6:9f24:c8f9:196c:1841:fe87:bb84 discussió‎ 5.755 octets −8‎ Cap resum de modificació desfés

actprev 07:3507:35, 1 juny 2024‎ Magioladitis discussió contribucions‎ m 5.763 octets −1‎ Moved punctuation mark to correct place + other fixes, References after punctuation per WP:CITEFOOT and WP:PAIC desfés Etiqueta: AWB

actprev 06:5406:54, 21 maig 2024‎ LucasBrown discussió contribucions‎ 5.764 octets +49‎ Adding short description: "Machine learning algorithm" desfés Etiqueta: Shortdesc helper

actprev 09:2309:23, 13 des 2023‎ 84.92.101.125 discussió‎ 5.715 octets −3‎ →‎Algorithm desfés

actprev 13:3813:38, 5 des 2023‎ C8uyPqgR discussió contribucions‎ 5.718 octets +15‎ Changed from the notation used in the first edition of Richard Sutton's 'Reinforcement Learning' to that of the second edition desfés

actprev 05:0805:08, 27 nov 2023‎ C8uyPqgR discussió contribucions‎ 5.703 octets +2‎ Cap resum de modificació desfés

actprev 06:3306:33, 9 ago 2023‎ 68.5.88.55 discussió‎ 5.701 octets +1‎ fix init value section desfés

actprev 03:3203:32, 17 maig 2023‎ 金色黎明 discussió contribucions‎ 5.700 octets +74‎ →‎Discount factor (gamma): fix bare link desfés

actprev 13:2313:23, 30 des 2022‎ Thatsme314 discussió contribucions‎ m 5.626 octets 0‎ →‎See also: lowercase desfés

actprev 17:5617:56, 1 nov 2022‎ Scyllagist discussió contribucions‎ m 5.626 octets 0‎ to --> on desfés Etiqueta: editor de codi 2017

actprev 14:3514:35, 31 oct 2022‎ 129.26.135.254 discussió‎ 5.626 octets −335‎ the footnote is in [1], the current ref [2] has nothing on footnotes and such. desfés Etiqueta: references removed

actprev 23:1823:18, 3 jul 2022‎ Marcocnl88 discussió contribucions‎ m 5.961 octets −7‎ Removed the word "simply", words like this add little value and most often the opposite is true (i.e. not simple at all). desfés

actprev 15:2115:21, 2 jul 2022‎ SamL 199917 discussió contribucions‎ 5.968 octets +14‎ easier to understand algorithm desfés

actprev 16:2716:27, 4 maig 2022‎ Niplav discussió contribucions‎ 5.954 octets +78‎ Cap resum de modificació desfés Etiqueta: editor visual

actprev 16:4216:42, 5 des 2021‎ Mruanova discussió contribucions‎ m 5.876 octets +451‎ Analytics India Magazine desfés Etiqueta: editor visual

actprev 15:4715:47, 29 set 2021‎ Fwagen discussió contribucions‎ m 5.425 octets +23‎ →‎Discount factor (gamma): added (Retrieved 2021-09-29) to ref. desfés
actprev 15:4515:45, 29 set 2021‎ Fwagen discussió contribucions‎ m 5.402 octets +132‎ →‎Discount factor (gamma): add the term myopic with a ref. desfés

actprev 05:1405:14, 12 jul 2021‎ Hooman Mallahzadeh discussió contribucions‎ m 5.270 octets +19‎ Collapsing sidebar. desfés

actprev 05:5905:59, 6 maig 2021‎ OAbot discussió contribucions‎ m 5.251 octets +16‎ Open access bot: doi added to citation with #oabot. desfés

actprev 00:4700:47, 4 març 2021‎ 2001:56a:f99b:7700:d581:6203:3e65:c752 discussió‎ 5.235 octets +22‎ Cap resum de modificació desfés

actprev 09:2709:27, 6 gen 2021‎ 80.114.172.70 discussió‎ 5.213 octets −2‎ →‎Algorithm desfés

actprev 21:0421:04, 5 des 2020‎ Monkbot discussió contribucions‎ m 5.215 octets −5‎ Task 18 (cosmetic): eval 3 templates: del empty params (1×); desfés Etiqueta: AWB

actprev 04:4304:43, 21 set 2020‎ Citation bot discussió contribucions‎ 5.220 octets +16‎ Add: s2cid, author pars. 1-1. Removed parameters. Some additions/deletions were actually parameter name changes. | You can use this bot yourself. Report bugs here. | Suggested by Abductive | Category:Machine learning algorithms | via #UCB_Category desfés

actprev 04:0504:05, 7 jul 2020‎ Eudamonic discussió contribucions‎ 5.204 octets +30‎ added Differentiable computing navbox desfés

actprev 03:5303:53, 3 jul 2020‎ 203.177.172.11 discussió‎ 5.174 octets +2‎ →‎Algorithm desfés

actprev 04:4604:46, 3 maig 2020‎ Vthierry discussió contribucions‎ 5.172 octets +6‎ →‎Algorithm desfés

actprev 10:1810:18, 6 feb 2020‎ Pxenviq discussió contribucions‎ 5.166 octets −2‎ Undid revision 939416119 by Pxenviq (talk) desfés Etiqueta: Desfés
actprev 10:0710:07, 6 feb 2020‎ Pxenviq discussió contribucions‎ 5.168 octets +2‎ Cap resum de modificació desfés

actprev 22:4422:44, 3 des 2019‎ Citation bot discussió contribucions‎ m 5.166 octets +75‎ Add: url. | You can use this bot yourself. Report bugs here.| Activated by User:Nemo bis | via #UCB_webform desfés

actprev 21:1721:17, 26 nov 2019‎ Diageo11 discussió contribucions‎ m 5.091 octets +1‎ typo desfés Etiqueta: editor visual

actprev 09:4309:43, 17 oct 2019‎ CjF discussió contribucions‎ 5.090 octets +270‎ Cap resum de modificació desfés

actprev 22:4122:41, 10 jul 2019‎ 94.212.245.18 discussió‎ 4.820 octets −22‎ Remove link to Wikiversary (not working, actual article is incomplete) desfés

actprev 07:0707:07, 5 jul 2019‎ Citation bot discussió contribucions‎ m 4.842 octets −8‎ Removed URL that duplicated unique identifier. | You can use this bot yourself. Report bugs here.| Activated by User:Marianne Zimmerman desfés

actprev 12:1112:11, 26 feb 2019‎ The Anome discussió contribucions‎ 4.850 octets 0‎ fmt desfés Etiqueta: editor visual

actprev 13:0513:05, 15 feb 2019‎ Justin Ormont discussió contribucions‎ m 4.850 octets +8‎ linked learning rate desfés

actprev 13:4713:47, 9 nov 2018‎ Headbomb discussió contribucions‎ m 4.842 octets −1‎ ce desfés

actprev 02:0802:08, 10 jul 2018‎ Josvebot discussió contribucions‎ m 4.843 octets +48‎ Bot: fixing WP:CHECKWIKI error #37 (no DEFAULTSORT for article with special character) desfés

actprev 14:4614:46, 11 març 2018‎ Bderrett discussió contribucions‎ m 4.795 octets −4‎ Fix typo desfés Etiqueta: editor visual

actprev 21:3921:39, 9 març 2018‎ Bderrett discussió contribucions‎ m 4.799 octets −74‎ Clarify that Q-learning attempts to compute the state-action value function of the optimal policy. desfés Etiqueta: editor visual

actprev 22:5822:58, 28 feb 2018‎ Lfstevens discussió contribucions‎ 4.873 octets +25‎ →‎top: ce, ref cleanup desfés Etiqueta: editor visual

actprev 19:3219:32, 6 feb 2018‎ Bomberzocker discussió contribucions‎ 4.848 octets +9‎ cited wrong chapter, fixed formula special characters. Sorry. desfés
actprev 19:2719:27, 6 feb 2018‎ Bomberzocker discussió contribucions‎ 4.839 octets −27‎ old url returned http 404 error, fixed this. Changing formula to t+1 again based on updated source. Norvig & Russel may have an error in their book. Needs further research. desfés
actprev 19:0919:09, 6 feb 2018‎ 89.3.238.121 discussió‎ 4.866 octets +101‎ Cap resum de modificació desfés

actprev 14:3914:39, 3 feb 2018‎ 128.119.241.213 discussió‎ 4.765 octets 0‎ Changed SARSA to Sarsa. See, for example, the current drafts of the 2nd edition of Sutton and Barto's book: Reinforcement Learning an Introduction. desfés

actprev 11:5811:58, 1 feb 2018‎ Bomberzocker discussió contribucions‎ 4.765 octets −2‎ →‎Algorithm: equation had a mistake. Source: Stuart Russel & Peter Norvig: Artificial Intelligence: A Modern Approach desfés

actprev 10:0910:09, 29 oct 2017‎ 2.242.24.134 discussió‎ 4.767 octets +4‎ corrected the formular according to: http://incompleteideas.net/sutton/book/ebook/node64.html . r_t or r_{t+1} depends on whether the environment reacts instantaneaously or one time step later. it appears to make more sense to assume a temporal delay. desfés

actprev 02:4102:41, 20 set 2017‎ Tony1 discussió contribucions‎ 4.763 octets +8‎ Cap resum de modificació desfés
actprev 02:4002:40, 20 set 2017‎ Tony1 discussió contribucions‎ m 4.755 octets 0‎ Tony1 moved page State-Action-Reward-State-Action to State–action–reward–state–action: Not a protocol; refers to a sequence. desfés

actprev 14:2514:25, 4 jul 2017‎ Drbepp discussió contribucions‎ m 4.755 octets −4‎ link to reference 2 (Sutton's book) updated, old link was broken desfés

actprev 07:1807:18, 10 maig 2017‎ Download discussió contribucions‎ 4.759 octets −1‎ spacing desfés

1 jul 2024

1 juny 2024

21 maig 2024

13 des 2023

5 des 2023

27 nov 2023

9 ago 2023

17 maig 2023

30 des 2022

1 nov 2022

31 oct 2022

3 jul 2022

2 jul 2022

4 maig 2022

5 des 2021

29 set 2021

12 jul 2021

6 maig 2021

4 març 2021

6 gen 2021

5 des 2020

21 set 2020

7 jul 2020

3 jul 2020

3 maig 2020

6 feb 2020

3 des 2019

26 nov 2019

17 oct 2019

10 jul 2019

5 jul 2019

26 feb 2019

15 feb 2019

9 nov 2018

10 jul 2018

11 març 2018

9 març 2018

28 feb 2018

6 feb 2018

3 feb 2018

1 feb 2018

29 oct 2017

20 set 2017

4 jul 2017

10 maig 2017