dc.contributor.author |
Victoria Coll, Marc |
dc.date.accessioned |
2015-12-23T12:03:36Z |
dc.date.available |
2015-12-23T12:03:36Z |
dc.date.issued |
2015-12-23 |
dc.identifier.uri |
http://hdl.handle.net/10230/25521 |
dc.description |
Treball de fi de grau en informàtica |
dc.description |
Tutor: David Nettleton |
dc.description.abstract |
Cuando hablamos de la Deep Web nos referimos a aquella zona de internet en la cual sus páginas web no están indexadas en los buscadores, ya que estos, no pueden acceder a ellas por varios motivos, como por ejemplo, que la web tenga contraseña./nExisten varios niveles de dificultad en cuanto al acceso, cada cual más difícil que el anterior y se requieren programas especiales para ello. Además esta zona oculta esconde el 80% de la información disponible en Internet, parte de la cual puede ser de carácter personal y/o confidencial. Por este motivo he realizado una investigación sobre la información confidencial/ny personal que se puede encontrar en la Deep Web. He diseñado y programado un crawler que busca en ella, todo tipo de páginas que contengan los datos que el usuario ha introducido en el programa como puede ser su nombre, una dirección o un número de teléfono. Este programa, que he llamado "Deep Info!", realiza una búsqueda y posterior análisis para extraer un informe sobre toda la información recuperada que es relevante para el usuario que ha introducido los datos. Las pruebas realizadas con diferentes casos de uso han verificado el correcto funcionamiento de la aplicación. |
dc.description.abstract |
Quan parlem de la Deep Web ens referim a aquella zona d’Internet en la qual,/nles seves pàgines web no estan indexades als cercadors ja que aquests no poden accedirhi/nper diversos motius, com per exemple, que la web estigui protegida amb una/ncontrasenya./nHi ha diversos nivells de dificultat en quant a l'accés, cadascú més difícil que/nl'anterior i es requereixen programes especials per a això. A més aquesta zona oculta/namaga el 80% de la informació disponible a Internet, part de la qual pot ser de caràcter/npersonal i/o confidencial./nPer aquest motiu he realitzat una investigació sobre la informació confidencial i/npersonal que es pot trobar a la Deep Web. He dissenyat i programat un crawler que/nbusca en ella, tot tipus de pàgines que continguin les dades que l'usuari ha introduït en/nel programa com pot ser el seu nom, una adreça o un número de telèfon./nAquest programa, que he anomenat "Deep Info!", realitza una recerca i posterior/nanàlisi per extreure un informe sobre tota la informació recuperada que és rellevant per/na l’usuari que ha introduït les dades. Les proves realitzades amb diferents casos d'ús han/nverificat el correcte funcionament de l'aplicació. |
dc.description.abstract |
The term Deep Web refers to the areas of Internet where web pages are not/nindexed in search engines due to the fact that these search engines may not have access/nthem for different reasons, for example, the existence of a web login/password/nrequirement./nThere are several levels of difficulty in accessing the Deep Web, each one more/nchallenging than the previous one, and is it important to consider that special programs/nare required to enter these sites. Besides, this hidden area holds 80% of the information/navailable online, and some of this information may be personal and/or confidential./nFor this reason I carried out a study of the confidential and personal information that/nmay be found in the Deep Web. In order to do that, I designed and programmed a/ncrawler capable of searching in the Deep Web, in pages that contain data that the user/nentered in the program query interface such as his name, address or phone number./nThis program, which I called "Deep Info!", performs a search and subsequent/nanalysis to extract a report on all the retrieved information that is relevant to the user/nwho entered his data. Tests with different use cases have verified the correct functioning/nof the application. |
dc.format.mimetype |
application/pdf |
dc.language.iso |
spa |
dc.rights |
Attribution-NonCommercial-NoDerivs 3.0 Spain |
dc.rights.uri |
http://creativecommons.org/licenses/by-nc-nd/3.0/es/ |
dc.subject.other |
Internet |
dc.subject.other |
Recuperació de la informació |
dc.subject.other |
Protecció de dades |
dc.title |
Deep Info! Buscador de datos personales en la Deep Web |
dc.type |
info:eu-repo/semantics/bachelorThesis |
dc.rights.accessRights |
info:eu-repo/semantics/openAccess |