Sistemas gestores de Ficheros Convencionales. Clasificación de los ficheros según su uso: 1. Permanentes: Estos permanecen inalterables en el tiempo, estos duran lo que dura la aplicación. 1.1. Maestros: Actualizan la información de los campos con mucha frecuencia y a tiempo real, contienen la información de la entidad. 1.2. Constantes: Rara vez se modifican, son los archivos importantes. 1.3. Históricos: Son resultados de problemas que pueden ser usados posteriormente para consultas. 1. Temporales: Duran poco tiempo desde su creación. 1.1. De Movimiento: Contienen información para la actualización de los “maestros” y son destruidos cuando termina la actualización, son sobrescritos por las actualizaciones necesarias hasta cierto tamaño o a decisión del usuario/administración. 1.2. De Maniobra: Contienen información relativa a un proceso que no ha finalizado. Creados por los programas que lo necesitan, son eliminados tras finalizar el proceso. (extensión .Tmp). Modos de organización y acceso.
• Modos de Organización Es la forma de estructurar y almacenar los datos en un dispositivo de almacenamiento, este varía la organización de un fichero, definido durante su creación y no modificado durante su existencia. Su tamaño y frecuencia favorecen a la elección de la organización. El elemento fundamental en la gestión de archivos es la direccionabilidad estableciendo la relación lógica y los archivos, a la que a cada celda se le asignara una dirección que podrán ser registros o conjuntos de Registros. Según su direccionabilidad: • Archivos sin dirección: Archivos secuenciales. Aquellos archivos que no se pueden acceder desde una dirección, la única forma de acceder sería leyendo toda la secuencia de ficheros. • Archivos con dirección: Aquellos en los que existen la relación entre contenido y ubicación de estos. Permiten el acceso directo a los datos. Esto se logra gracias a que los espacios están dividas entre segmentos. (Direccionables individualmente). Para identificar cada registro con un archivo de dirección, se le asocia un dato denominado clave.
Existen varios modos de asociar claves con direcciones, permitiendo una distinta organización. • Sin conversión clave -> Dirección: ARCHIVOS DE ACCESO DIRECTO. La clave es igual a la Dirección, numéricas. Este método no aprovecha recursos si las claves no están ordenadas secuencialmente. • Con conversión clave -> Dirección Asociación CLAVE-DIRECCIÓN aplicando una función de asociación (HASH). La función HASH nos permite obtener la dirección. F(CLAVE)=DIRECCIÓN ▫ No ha de ser compleja, para evitar ralentización. ▫ No existir un mínimo de huecos. ▫ Minimizar las colisiones. Cuando dos funciones dan la misma dirección. Asociación CLAVE-DIRECCIÓN MEDIANTE BÚSQUEDA EN UN INDICE. También denominado acceso DINÁMICO, siendo este DIRECTO o por un índice de registro, siendo a partir de este un acceso a los demás registros de forma secuencial. Los ficheros Indexeados constan de: ▫ Área de índices: Archivo secuencial creado por el sistema, en la que el A. Primaria es dividida en diferentes segmentos. Y en cada uno se almacena la dirección de inicio y la más alta. ▫ Área primaria: Contiene los datos. Ordenados de forma Ascendente por su CLAVE. ▫ Área de Overflow: Añade nuevos registros que no se introducen en la primaria para no reorganizarla o cuando no hay espacio en esta. Para realizar una búsqueda, localizaremos en el área de índice, aquel registro que supere la clave a buscar, para así tener localizado el segmento donde se encuentra. Así se busca en ese segmento y si no se encuentra observamos el área de Overflow hasta hallar el registro, si sigue sin aparecer este no se encuentra. Modos de Acceso La forma en la que un dispositivo maneja la información, centrándose en un determinado lugar para realizar cualquier tipo de operación. 1. Acceso Secuencial: Se accede al primer registro del archivo, y después se va secuencialmente leyendo los registros hasta llegar al deseado. 2. Acceso Directo: Se posiciona en cualquier registro sin necesidad de acceder a los anteriores. En este modo pueden usarse la organización directa y con la indexeada. La Organización directa, proporciona al dispositivo la posición del registro al que se quiere acceder. Se puede calcular su posición a partir de su clave mediante de una función o aleatoriamente (HASH) Archivos indexeados, el acceso es de manera automática a partir del valor campo de clave, usándose un conjunto de índices ( CLAVE-REGISTRO) Operaciones sobre los ficheros • Operación sobre un fichero. O Creación: Se ha de crear. O Apertura: El acceso para poder realizar las operaciones. O Ordenación: Se establece un orden mediante unos criterios previamente establecidos, en relación a la información almacenada en uno o varios campos. O Compactación: Reorganización de ficheros eliminando vacíos. O Cierre: Para evitar modificaciones indebidas se ha de cerrar. • Operaciones en los registros de un fichero o Actualización: Modificación o eliminación, para mantener el fichero actualizado. O Consulta: Permite el acceso para ver su contenido, sin modificarlo. O Operaciones en las que se crean nuevos ficheros: o Copia: Se crea un mismo fichero con la misma estructura y organización. O Intersección: Se crea un nuevo fichero partiendo de otros con la misma estructura reuniendo información común. O Concatenación: A partir de 2 ficheros con la misma estructura se crea un tercero que contiene la información de ambos. O Partición: Se crea uno o más ficheros con la misma estructura y contenido, en función de la carácterística elegida. Problemas en la Gestión de datos con sistemas gestores de ficheros. Estos sistemas pueden tener 2 tipos de problemas: 1. Respecto de los ficheros: a. Integridad Semántica: Son conjunto de restricciones, son las reglas necesarias para limitar que datos pueden ser almacenados o no. B. Control de autorizaciones: Evitar accesos indebidos a los datos, por lo que se le asigna a cada usuario un identificador y una clave, para así controlar quien accede a estos datos. C. Control de concurrencia: El acceso simultáneo a un dato al que se va modificar. Se le dará prioridad al primero en ingresar. 2. Respecto de los datos: a. Redundancia: Repetición innecesaria de información. B. Inconsistencia: Los datos de los distintos ficheros no concuerdan entre sí. C. Aislamiento: Cuando los datos son almacenados en distintos ficheros, dificultando el acceso a la información de forma completa. Carácterísticas generales y ventajas de una base de datos. El diseño de bases de datos aporta 2 ventajas, siendo: • La independencia lógica de datos, los cambios realizados en un objeto de la base de datos no obligan a modificar a otros objetos. • La independencia física de los datos estos no depende del dispositivo de almacenamiento donde se guarda. Carácterísticas: Desempeño: Se intenta asegurar el tiempo de respuesta adecuado en la relación hombre-maquina. Mínima redundancia: La redundancia es uno de los principales problemas presentes en los sistemas de procesamiento de información, de ahí a que surgiesen las bases de datos con el objetivo de reducir la redundancia, ya que no la evitan completamente. Pero sin aumentar su complejidad de estructura o desempeño. Capacidad de acceso: Se debe mejorar el tiempo de respuesta, para cuando se pidan datos a la base de datos. Esto aumenta el coste computacional. Simplicidad: Están basadas en representaciones lógicas simples, en la que se verifiquen las modificaciones y no presenten una relación compleja. Integridad: Cada dato debe ser verídico. Seguridad y privacidad: La seguridad de una base hace referencia a la capacidad para protegerse de pérdida total o parcial por fallos o accesos accidentales. • Seguridad contra destrucción de datos causadas por entorno. • Seguridad contra destrucción de datos causada por fallos del sistema. • Seguridad contra accesos no autorizados a la base. • Seguridad contra accesos indebidos a los datos. Deben existir en la base de datos procedimientos de recuperación de datos por si estos son perdidos total o parcialmente. Afinación: Referencia a la organización física de la información, la cual determina el tiempo de respuesta. Los datos evolucionan con el tiempo, de ahí a que la organización no puede ser buena en unos momentos dados. De ahíla base a de ser flexible ante modificaciones de esta organización, sin que afecte a los procedimientos u representación de los datos. Interfaz con el pasado y el futuro: El problema evoluciona con el tiempo, y sus organizaciones cambian en función de este cambiando la información correspondiente al subsistema o dominio del problema. De ahí a que la base este abierta a estos cambios y que no afecten a procedimientos que ya existen. Ventajas de una base de datos: o Control centralizado: DATOS, USUARIOS Y ACCESOS o Mayor coherencia de los datos al eliminar inconsistencias de datos, minimizar la redundancia, tener procesos para transiciones y más facilidad en la gestión de errores. O Almacenamiento físico eficiente (compacto) basados en ficheros e independientes al equipo lógico. O Mantenimiento de la integridad, compartir estos datos entre los usuarios y sean modificados.
• Modos de Organización Es la forma de estructurar y almacenar los datos en un dispositivo de almacenamiento, este varía la organización de un fichero, definido durante su creación y no modificado durante su existencia. Su tamaño y frecuencia favorecen a la elección de la organización. El elemento fundamental en la gestión de archivos es la direccionabilidad estableciendo la relación lógica y los archivos, a la que a cada celda se le asignara una dirección que podrán ser registros o conjuntos de Registros. Según su direccionabilidad: • Archivos sin dirección: Archivos secuenciales. Aquellos archivos que no se pueden acceder desde una dirección, la única forma de acceder sería leyendo toda la secuencia de ficheros. • Archivos con dirección: Aquellos en los que existen la relación entre contenido y ubicación de estos. Permiten el acceso directo a los datos. Esto se logra gracias a que los espacios están dividas entre segmentos. (Direccionables individualmente). Para identificar cada registro con un archivo de dirección, se le asocia un dato denominado clave.
Existen varios modos de asociar claves con direcciones, permitiendo una distinta organización. • Sin conversión clave -> Dirección: ARCHIVOS DE ACCESO DIRECTO. La clave es igual a la Dirección, numéricas. Este método no aprovecha recursos si las claves no están ordenadas secuencialmente. • Con conversión clave -> Dirección Asociación CLAVE-DIRECCIÓN aplicando una función de asociación (HASH). La función HASH nos permite obtener la dirección. F(CLAVE)=DIRECCIÓN ▫ No ha de ser compleja, para evitar ralentización. ▫ No existir un mínimo de huecos. ▫ Minimizar las colisiones. Cuando dos funciones dan la misma dirección. Asociación CLAVE-DIRECCIÓN MEDIANTE BÚSQUEDA EN UN INDICE. También denominado acceso DINÁMICO, siendo este DIRECTO o por un índice de registro, siendo a partir de este un acceso a los demás registros de forma secuencial. Los ficheros Indexeados constan de: ▫ Área de índices: Archivo secuencial creado por el sistema, en la que el A. Primaria es dividida en diferentes segmentos. Y en cada uno se almacena la dirección de inicio y la más alta. ▫ Área primaria: Contiene los datos. Ordenados de forma Ascendente por su CLAVE. ▫ Área de Overflow: Añade nuevos registros que no se introducen en la primaria para no reorganizarla o cuando no hay espacio en esta. Para realizar una búsqueda, localizaremos en el área de índice, aquel registro que supere la clave a buscar, para así tener localizado el segmento donde se encuentra. Así se busca en ese segmento y si no se encuentra observamos el área de Overflow hasta hallar el registro, si sigue sin aparecer este no se encuentra. Modos de Acceso La forma en la que un dispositivo maneja la información, centrándose en un determinado lugar para realizar cualquier tipo de operación. 1. Acceso Secuencial: Se accede al primer registro del archivo, y después se va secuencialmente leyendo los registros hasta llegar al deseado. 2. Acceso Directo: Se posiciona en cualquier registro sin necesidad de acceder a los anteriores. En este modo pueden usarse la organización directa y con la indexeada. La Organización directa, proporciona al dispositivo la posición del registro al que se quiere acceder. Se puede calcular su posición a partir de su clave mediante de una función o aleatoriamente (HASH) Archivos indexeados, el acceso es de manera automática a partir del valor campo de clave, usándose un conjunto de índices ( CLAVE-REGISTRO) Operaciones sobre los ficheros • Operación sobre un fichero. O Creación: Se ha de crear. O Apertura: El acceso para poder realizar las operaciones. O Ordenación: Se establece un orden mediante unos criterios previamente establecidos, en relación a la información almacenada en uno o varios campos. O Compactación: Reorganización de ficheros eliminando vacíos. O Cierre: Para evitar modificaciones indebidas se ha de cerrar. • Operaciones en los registros de un fichero o Actualización: Modificación o eliminación, para mantener el fichero actualizado. O Consulta: Permite el acceso para ver su contenido, sin modificarlo. O Operaciones en las que se crean nuevos ficheros: o Copia: Se crea un mismo fichero con la misma estructura y organización. O Intersección: Se crea un nuevo fichero partiendo de otros con la misma estructura reuniendo información común. O Concatenación: A partir de 2 ficheros con la misma estructura se crea un tercero que contiene la información de ambos. O Partición: Se crea uno o más ficheros con la misma estructura y contenido, en función de la carácterística elegida. Problemas en la Gestión de datos con sistemas gestores de ficheros. Estos sistemas pueden tener 2 tipos de problemas: 1. Respecto de los ficheros: a. Integridad Semántica: Son conjunto de restricciones, son las reglas necesarias para limitar que datos pueden ser almacenados o no. B. Control de autorizaciones: Evitar accesos indebidos a los datos, por lo que se le asigna a cada usuario un identificador y una clave, para así controlar quien accede a estos datos. C. Control de concurrencia: El acceso simultáneo a un dato al que se va modificar. Se le dará prioridad al primero en ingresar. 2. Respecto de los datos: a. Redundancia: Repetición innecesaria de información. B. Inconsistencia: Los datos de los distintos ficheros no concuerdan entre sí. C. Aislamiento: Cuando los datos son almacenados en distintos ficheros, dificultando el acceso a la información de forma completa. Carácterísticas generales y ventajas de una base de datos. El diseño de bases de datos aporta 2 ventajas, siendo: • La independencia lógica de datos, los cambios realizados en un objeto de la base de datos no obligan a modificar a otros objetos. • La independencia física de los datos estos no depende del dispositivo de almacenamiento donde se guarda. Carácterísticas: Desempeño: Se intenta asegurar el tiempo de respuesta adecuado en la relación hombre-maquina. Mínima redundancia: La redundancia es uno de los principales problemas presentes en los sistemas de procesamiento de información, de ahí a que surgiesen las bases de datos con el objetivo de reducir la redundancia, ya que no la evitan completamente. Pero sin aumentar su complejidad de estructura o desempeño. Capacidad de acceso: Se debe mejorar el tiempo de respuesta, para cuando se pidan datos a la base de datos. Esto aumenta el coste computacional. Simplicidad: Están basadas en representaciones lógicas simples, en la que se verifiquen las modificaciones y no presenten una relación compleja. Integridad: Cada dato debe ser verídico. Seguridad y privacidad: La seguridad de una base hace referencia a la capacidad para protegerse de pérdida total o parcial por fallos o accesos accidentales. • Seguridad contra destrucción de datos causadas por entorno. • Seguridad contra destrucción de datos causada por fallos del sistema. • Seguridad contra accesos no autorizados a la base. • Seguridad contra accesos indebidos a los datos. Deben existir en la base de datos procedimientos de recuperación de datos por si estos son perdidos total o parcialmente. Afinación: Referencia a la organización física de la información, la cual determina el tiempo de respuesta. Los datos evolucionan con el tiempo, de ahí a que la organización no puede ser buena en unos momentos dados. De ahíla base a de ser flexible ante modificaciones de esta organización, sin que afecte a los procedimientos u representación de los datos. Interfaz con el pasado y el futuro: El problema evoluciona con el tiempo, y sus organizaciones cambian en función de este cambiando la información correspondiente al subsistema o dominio del problema. De ahí a que la base este abierta a estos cambios y que no afecten a procedimientos que ya existen. Ventajas de una base de datos: o Control centralizado: DATOS, USUARIOS Y ACCESOS o Mayor coherencia de los datos al eliminar inconsistencias de datos, minimizar la redundancia, tener procesos para transiciones y más facilidad en la gestión de errores. O Almacenamiento físico eficiente (compacto) basados en ficheros e independientes al equipo lógico. O Mantenimiento de la integridad, compartir estos datos entre los usuarios y sean modificados.