Tesis - Autocontenida de documentos HTML
La Era de la Informacion es nuestra era. Es un periodo historico caracterizado por una revolucion tecnologica centrada en las tecnologıas digitales de informacion y comunicacion, concomitante, pero no causante, con la emergencia de una estructura social en red, en todos los ambitos de la actividad humana, y con la interdependencia global de dicha actividad. Es un proceso de transformacion multidimensional que es a la vez incluyente y excluyente en funcion de los valores e intereses dominantes en cada proceso, en cada paıs y en cada organizacion social. . .Manuel Castells.
Un modelo formal abstrae las caracterısticas generales y las comunes de un conjunto de sistemas desarrollados para problemas similares, explicando sus estructuras y procesos. En esta seccion se revisan brevemente los fundamentos matematicos requeridos para realizar una discusion acerca de la definicion de un modelo de representacion de documentos. Estos conceptos incluyen: “conjuntos”, “relacion”, “funcion”, “secuencia”, “tupla”, “cadena” (o string), “grafo”,“´algebra”, “espacio medible” y “espacio de medida”, “espacio de probabilidad”, “espacio vectorial” y “espacio topologico”. A partir de ellos se podr´a definir formalmente un modelo de representacion de documentos.
Los modelos de representacion vectoriales son un tipo dentro del conjunto de tecnicas de representacion de documentos que han sido muy empleadas en sistemas de IR, TC y DC en los ultimos años. Las representaciones vectoriales resultan muy sencillas y descansan sobre la premisa de que el significado de un documento puede derivarse del conjunto de rasgos presentes en el mismo. Representan modelos formales y pueden considerarse “basados en rasgos” –o caracterısticas–; estos rasgos seran, de un modo u otro, los vectores generadores de un espacio vectorial. Los documentos se modelan como conjuntos de rasgos que pueden ser individualmente tratados y pesados.
Funciones de ponderacion
En la literatura pueden encontrarse multitud de funciones de ponderacion empleadas para calcular la importancia, o relevancia, de un rasgo en el contenido de un texto. Estas funciones constituyen funciones de proyeccion F dentro de una definici´on de modelo de representacion de documentos. Son de caracter variado, dependiendo del uso posterior que se vaya a dar a la representacion. Estas funciones pueden emplear parametros diferentes segun los casos; desde la frecuencia de aparici´on de un rasgo en el documento o en la colecci´on, hasta probabilidades condicionadas de un rasgo a una clase en problemas de TC.
Seleccion del vocabulario
En esta seccion se introducen algunos aspectos relacionados con la seleccion de rasgos como elementos de transformacion de una informacion que inicialmente es de caracter cualitativo y que debe ser transformada a un conjunto de objetos X dentro de un espacio medible hX, Bi, de caracter cuantitativo.
Enlaces para el material =(PDF)=: Link Seguro, Links Alternativo.
Fuente: Tesis - Autocontenida de documentos HTML.PDF
Paginas relacionadas: Literaturas y otras cuestiones morales, Ceo Developers, Geniality Software.
Nota: Si el material te ha servido de ayuda por favor comparte el post, necesitamos que aumente el numero de personas que conocen acerca de estos temas, estamos en la revolucion informatica y todos debemos poner un poco de nuestra parte, para que este movimiento nunca muera. Unidos por la informatica.
No hay comentarios:
Publicar un comentario
Si tienes alguna duda, escribenos.