Mostrar el registro sencillo del objeto digital

dc.contributor Nikolaevna Ledeneva, Yulia
dc.contributor.author García Martínez, Detzani
dc.date.accessioned 2017-09-26T16:15:16Z
dc.date.available 2017-09-26T16:15:16Z
dc.date.issued 2017-06
dc.identifier.uri http://hdl.handle.net/20.500.11799/67394
dc.description.abstract Hoy en día, la mayoría de personas tiene la necesidad de usar internet para mantenerse actualizados teniendo acceso ilimitado a la información, entre ellos se encuentra la necesidad de utilizar las redes sociales para comunicarse con familiares o amigos y compartir intereses en común sin importar la distancia (Echeverría, 2013). Existe una gran cantidad de medios sociales ofrecidos por internet como Twitter que es una red social de servicios web de micro-blogs muy populares, fue fundada en 2006 y en tan solo 10 años se ha convertido en una de las redes sociales más populares del internet, con más de 600 millones de usuarios. Según la estadística de Miniwatts Marketing Group (MMG, 2017), en abril del presente año existían 3,739,698,500 usuarios en internet, lo que significa que más de 16.5% de personas usan Twitter como medio de comunicación. La Fundación Española de la Ciencia y la Tecnología (FECYT, 2017) en abril del presente año, presento los resultados de la VIII Encuesta de la Percepción Social de la Ciencia, menciona que las redes sociales se sitúan como la fuente preferida de los ciudadanos para informarse sobre temas científicos, en un porcentaje de un 43,6%. Twitter permite a los usuarios de la red enviar mensajes cortos de hasta 140 caracteres de texto, llamados “tweets”, compartiendo información de cualquier actividad diaria que expresa intereses en tiempo real. Debido a la gran cantidad de texto generada por cada usuario, se convierte en una mina de datos por explorar, conocer y abundar de manera más profunda o analítica, para ello es necesario obtener información de los tweets que resulten relevantes a una temática en específico. En los miles de millones de tweets que circulan en la red diariamente se pueden encontrar diversos temas de interés para fines diversos como tendencias, preferencias, aptitudes, experiencia, marketing, entre otros a través de palabras clave. Las palabras clave son palabras que capturan los temas principales de un documento y benefician tareas de procesamiento del lenguaje natural como: resúmenes, recuperación de información y respuesta a preguntas (Kim et al., 2010). En esta tesis, para la tarea de extracción de palabras clave se identifica un conjunto de características en común que hay dentro de un texto, las cuales trabajan a nivel léxico, denominado, patrones léxicos. Los patrones léxicos son secuencias de caracteres generadas a través de reglas (definidas por el lenguaje), las cuales representan palabras candidatas a ser palabras clave (Hernández, 2016), (Gallegos, 2016). Pueden ser obtenidas a partir de secuencias con un número de repeticiones llamadas secuencias frecuencias maximales (García, 2004), (García, 2006), (Camacho, 2015). En el presente trabajo, se extraen palabras clave a partir de patrones léxicos en Twitter, se realizaron experimentos con el corpus “Opinosis” que está constituido por 51 archivos que cuentan con tweets, se crearon dos gold standard: el primero está conformado por palabras clave como frases nominales (Bellaachia et al., 2014) y el segundo se conforma por palabras clave donde cada archivo cuenta con palabras clave asignadas manualmente. Los resultados obtenidos en esta tesis se comparan con los métodos del estado del arte: TF-IDF (Hasan & Ng, 2010). y TextRank (Hasan & Ng, 2010), que son considerados métodos no supervisados para la extracción de palabras clave. es
dc.language.iso spa es
dc.publisher Universidad Autónoma del Estado de México es
dc.rights openAccess es
dc.rights openAccess es
dc.subject Palabras clave es
dc.subject Procesamiento de lenguaje Natural es
dc.subject Patrones léxicos es
dc.subject Redes sociales es
dc.subject Opinosis es
dc.title Extracción de palabras en twitter utilizando patrones léxicos es
dc.type Tesis de Licenciatura es
dc.provenance Académica es
dc.road Dorada es
dc.ambito Local es


Ficheros en el objeto digital

Este ítem aparece en la(s) siguiente(s) colección(ones)

Visualización del Documento

  • Título
  • Extracción de palabras en twitter utilizando patrones léxicos
  • Autor
  • García Martínez, Detzani
  • Director(es) de tesis, compilador(es) o coordinador(es)
  • Nikolaevna Ledeneva, Yulia
  • Fecha de publicación
  • 2017-06
  • Editor
  • Universidad Autónoma del Estado de México
  • Tipo de documento
  • Tesis de Licenciatura
  • Palabras clave
  • Palabras clave
  • Procesamiento de lenguaje Natural
  • Patrones léxicos
  • Redes sociales
  • Opinosis
  • Los documentos depositados en el Repositorio Institucional de la Universidad Autónoma del Estado de México se encuentran a disposición en Acceso Abierto bajo la licencia Creative Commons: Atribución-NoComercial-SinDerivar 4.0 Internacional (CC BY-NC-ND 4.0)

Mostrar el registro sencillo del objeto digital

Buscar en RI


Buscar en RI

Usuario

Estadísticas