Mostra el registre parcial de l'element
dc.contributor.author | Matyja, Monika |
dc.contributor.author | Morera, Jordi |
dc.contributor.author | Wolf, Sebastian |
dc.date.accessioned | 2020-01-21T15:03:54Z |
dc.date.available | 2020-01-21T15:03:54Z |
dc.date.issued | 2019 |
dc.identifier.uri | http://hdl.handle.net/10230/43323 |
dc.description | Treball fi de màster de: Master's Degree in Data Science. Curs 2018-2019 |
dc.description | Directors: Hrvoje Stojic, Anestis Papanikolaou |
dc.description.abstract | In this thesis we develop a traffic light control agent that can manage traffic lights with the objective to reduce traffic jams, trip time and other traffic metrics in a given network using reinforcement learning. To this end, we implement a Double Deep Q-Network algorithm and test its performance in controlling traffic lights on a ’small’ and a ’large’ traffic junction. We find that this algorithm beats a fixed traffic light phase program when traffic demand fluctuates, as it is capable of reacting to real-time traffic situations. The algorithm can be scaled up and holds promise to also perform well in controlling larger transport networks. |
dc.description.abstract | En aquest treball de final de màster es desenvolupa un algorisme d'aprenentatge reforçat pel control de semàfors amb l'objectiu de reduir temps de trajecte i retencions. Específicament, s'ha implementat l'algorisme Double Deep Q-Network i s'ha comprovat la seva eficàcia comparant-lo amb escenaris realistes de control d'una intersecció simple i d'una complexa. S'ha demostrat que aquest algorisme es comporta millor que l'escenari real en el qual el canvi de fase es duu a terme amb intervals de temps fixes. Els resultats indiquen que aquesta tècnica és capaç d'adaptar-se a les situacions de trànsit canviants i per tant obtenir millor resultats que l'escenari real. L'algorisme pot ser adaptat per controlar xarxes de trànsit més grans. |
dc.format.mimetype | application/pdf |
dc.language.iso | eng |
dc.rights | Atribución-NoComercial-SinDerivadas 3.0 España |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/es/ |
dc.subject.other | Treball de fi de màster – Curs 2018-2019 |
dc.subject.other | Aprenentatge per reforç |
dc.subject.other | Reinforcement learning |
dc.subject.other | Circulació |
dc.subject.other | Traffic flow |
dc.subject.other | Enginyeria del trànsit |
dc.subject.other | Traffic engineering |
dc.title | Deep reinforcement learning for the optimization of traffic light control with real-time data |
dc.type | info:eu-repo/semantics/masterThesis |
dc.rights.accessRights | info:eu-repo/semantics/openAccess |