Welcome to the UPF Digital Repository

Deep Info! Buscador de datos personales en la Deep Web

Show simple item record

dc.contributor.author Victoria Coll, Marc
dc.date.accessioned 2015-12-23T12:03:36Z
dc.date.available 2015-12-23T12:03:36Z
dc.date.issued 2015-12-23
dc.identifier.uri http://hdl.handle.net/10230/25521
dc.description Treball de fi de grau en informàtica
dc.description Tutor: David Nettleton
dc.description.abstract Cuando hablamos de la Deep Web nos referimos a aquella zona de internet en la cual sus páginas web no están indexadas en los buscadores, ya que estos, no pueden acceder a ellas por varios motivos, como por ejemplo, que la web tenga contraseña./nExisten varios niveles de dificultad en cuanto al acceso, cada cual más difícil que el anterior y se requieren programas especiales para ello. Además esta zona oculta esconde el 80% de la información disponible en Internet, parte de la cual puede ser de carácter personal y/o confidencial. Por este motivo he realizado una investigación sobre la información confidencial/ny personal que se puede encontrar en la Deep Web. He diseñado y programado un crawler que busca en ella, todo tipo de páginas que contengan los datos que el usuario ha introducido en el programa como puede ser su nombre, una dirección o un número de teléfono. Este programa, que he llamado "Deep Info!", realiza una búsqueda y posterior análisis para extraer un informe sobre toda la información recuperada que es relevante para el usuario que ha introducido los datos. Las pruebas realizadas con diferentes casos de uso han verificado el correcto funcionamiento de la aplicación.
dc.description.abstract Quan parlem de la Deep Web ens referim a aquella zona d’Internet en la qual,/nles seves pàgines web no estan indexades als cercadors ja que aquests no poden accedirhi/nper diversos motius, com per exemple, que la web estigui protegida amb una/ncontrasenya./nHi ha diversos nivells de dificultat en quant a l'accés, cadascú més difícil que/nl'anterior i es requereixen programes especials per a això. A més aquesta zona oculta/namaga el 80% de la informació disponible a Internet, part de la qual pot ser de caràcter/npersonal i/o confidencial./nPer aquest motiu he realitzat una investigació sobre la informació confidencial i/npersonal que es pot trobar a la Deep Web. He dissenyat i programat un crawler que/nbusca en ella, tot tipus de pàgines que continguin les dades que l'usuari ha introduït en/nel programa com pot ser el seu nom, una adreça o un número de telèfon./nAquest programa, que he anomenat "Deep Info!", realitza una recerca i posterior/nanàlisi per extreure un informe sobre tota la informació recuperada que és rellevant per/na l’usuari que ha introduït les dades. Les proves realitzades amb diferents casos d'ús han/nverificat el correcte funcionament de l'aplicació.
dc.description.abstract The term Deep Web refers to the areas of Internet where web pages are not/nindexed in search engines due to the fact that these search engines may not have access/nthem for different reasons, for example, the existence of a web login/password/nrequirement./nThere are several levels of difficulty in accessing the Deep Web, each one more/nchallenging than the previous one, and is it important to consider that special programs/nare required to enter these sites. Besides, this hidden area holds 80% of the information/navailable online, and some of this information may be personal and/or confidential./nFor this reason I carried out a study of the confidential and personal information that/nmay be found in the Deep Web. In order to do that, I designed and programmed a/ncrawler capable of searching in the Deep Web, in pages that contain data that the user/nentered in the program query interface such as his name, address or phone number./nThis program, which I called "Deep Info!", performs a search and subsequent/nanalysis to extract a report on all the retrieved information that is relevant to the user/nwho entered his data. Tests with different use cases have verified the correct functioning/nof the application.
dc.format.mimetype application/pdf
dc.language.iso spa
dc.rights Attribution-NonCommercial-NoDerivs 3.0 Spain
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/es/
dc.subject.other Internet
dc.subject.other Recuperació de la informació
dc.subject.other Protecció de dades
dc.title Deep Info! Buscador de datos personales en la Deep Web
dc.type info:eu-repo/semantics/bachelorThesis
dc.rights.accessRights info:eu-repo/semantics/openAccess

Thumbnail
Icon

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Advanced Search

Browse

My Account

Statistics

In collaboration with Compliant to Partaking